Esta nota técnica se dirige a responsables y encargados de tratamiento que aborden procesos de anonimización sobre conjuntos de datos. En una realidad en la que fuentes de datos independientes se interconectan y que, por diseño, pueden compartir atributos comunes, cabe la posibilidad de crear un rastro electrónico de los individuos, incluso cuando se hayan suprimido los datos que explícitamente les identifican, pudiendo llegar a establecerse vínculos entre dichas fuentes de información y constituir así una amenaza para la privacidad de los interesados cuyos datos están sujetos a tratamiento.
En aplicación del principio de Responsabilidad Proactiva establecido en el Reglamento (UE) 2016/679 General de Protección de Datos, el responsable debe abordar el estudio del riesgo inherente de reidentificación de los sujetos de los datos e implementar las medidas para gestionarlo. El objetivo de dicho análisis es alcanzar un balance correcto entre la necesidad de obtener unos resultados con una determinada fidelidad y el coste que el tratamiento puede tener para los derechos y libertades de los ciudadanos.
las fuentes de las que proceden los datos, pese a ser independientes, se interconectan, existe la posibilidad de crear un rastro electrónico de las personas
El tratamiento masivo de datos mediante el uso de técnicas basadas en big data, inteligencia artificial o machine learning obliga a la implementación de garantías o mecanismos para preservar la privacidad y el derecho a la protección de datos personales, entre ellas las basadas en la anonimización. En una realidad en la que las fuentes de las que proceden los datos, pese a ser independientes, se interconectan, existe la posibilidad de crear un rastro electrónico de las personas, incluso habiendo eliminado los datos que explícitamente les identifican.
Si bien el objetivo de los procesos de anonimización es preservar la privacidad de las personas cuyos datos son objeto de tratamiento, los datos, convenientemente agrupados y cruzados con otras fuentes de información, pueden utilizarse para identificarlas e incluso establecer relaciones con categorías especiales de datos asociadas a estas. Existe un riesgo de que, una vez que se ha anonimizado un conjunto de datos, se pueda revertir esa anonimización, reidentificando a la persona.
la K-anonimidad es una técnica utilizada cuando se tratan grandes grupos de datos y que, entre otros aspectos, permite estudiar el grado de identificación que podría existir en ese conjunto de datos supuestamente anónimo
Para realizar esta gestión de riesgos, la nota técnica analiza la K-anonimidad (PDF), una técnica utilizada cuando se tratan grandes grupos de datos y que, entre otros aspectos, permite estudiar el grado de identificación que podría existir en ese conjunto de datos supuestamente anónimo. En consecuencia, permite cuantificar hasta qué punto se preserva el anonimato de los sujetos presentes en un conjunto de datos en el que se han eliminado los identificadores.
En aplicación del principio de responsabilidad proactiva establecido en el Reglamento General de Protección de Datos (RGPD), la Agencia recuerda que el responsable debe analizar los riesgos en los tratamientos de datos, en este caso, los de reidentificación derivado de sus procesos de anonimización, y los generados en el proceso posterior y en el enriquecimiento de conjuntos de datos. Las medidas de Privacidad por Defecto y desde el Diseño seleccionadas deben implementarse mediante procesos formales que permitan la gestión de dichos riesgos.