INE, datos de móviles y los grandes riesgos del 'big data'

Como explica el autor, cabe la posibilidad de que la información agregada, pese a estar anonimizada, represente una intromisión a la intimidad de las personas

Foto: Turistas cruzando una calle en Valencia. (EFE)
Turistas cruzando una calle en Valencia. (EFE)

El Instituto Nacional de Estadística (INE) se propone realizar un seguimiento de nuestros movimientos a partir de los registros de las señales de telefonía móvil de las tres principales operadoras. Sería durante ocho días, entre el 18 de noviembre de 2019 y el 15 de agosto de 2020. El fin último, aprovechar el 'big data' para, en lugar de hacer encuestas, conocer aspectos como los desplazamientos diarios o vacacionales más habituales, así como observar con mayor precisión los flujos de personas en las zonas más despobladas. Para ello, se dividirá el territorio nacional en 3.500 celdas de un mínimo de 5.000 habitantes, celdas de mayor o menor extensión territorial en función de la densidad demográfica, y que solo afectarán a localidades de más de 15.000 habitantes.

Siempre a la vista de la poca información que ha trascendido, no parece que se vaya a conocer el titular del número móvil en cuestión; tampoco siquiera el número móvil en sí. Unos y otros son evidentemente datos personales y su obtención de este modo por parte del INE resultaría flagrantemente contraria a las leyes de datos, aunque solo fuese por no contar con el inequívoco consentimiento de los millones de ciudadanos interesados.

Si, por el contrario, como nos dicen sucedería, el INE no recibiera otra cosa que un recuento agregado y anonimizado, no parece a primera vista haber problemas. Según el propio INE, todo lo que llegarían a saber sería, por ejemplo, "cuántos móviles hay a las 17:00 horas en una calle determinada en cualquier ciudad de más de 15.000 habitantes, pero nada más". Es por un lado innegable que las leyes de datos y su propia legislación específica facultan a las autoridades estadísticas a recoger información personal. Y sucede además que si los datos que se ceden son anónimos, no serían siquiera 'datos personales', y, en consecuencia, la cesión (que implicará, por cierto, beneficio económico para las tres operadoras) quedaría totalmente al margen de la legislación de datos.

Una mirada más detenida nos alerta sin embargo de dos grandes problemas, ambos detectados además desde hace años por las autoridades europeas de protección de datos al aproximarse a estas cuestiones. El primero es la creciente dificultad de garantizar tecnológicamente el anonimato. Un muy reciente y autorizado estudio evidencia que tomando simplemente tres datos como código postal, sexo y fecha de nacimiento, cualquier persona de todo EEUU podría ser reidentificada en una base de datos 'anónima' con un 81% de probabilidad de acierto; si el territorio se reduce al estado de Massachusetts, por ejemplo, la probabilidad llega hasta el 99,98%. Como mínimo, el INE puede obtener con este estudio más de tres datos: domicilio, lugar de trabajo, lugar de vacaciones y hasta si se trabaja de noche.

El nivel de granularidad, es decir, de disgregación o de concreción de la información, que con ello puede llegar a alcanzarse, es realmente llamativo, como igualmente sucedía, por cierto, en el reciente estudio del propio INE que cruzaba datos de IRPF con zonas geográficas. ¿Cuántas personas trabajan en el turno de noche de una central de alarmas que es la única situada en la calle X y número Y de Alcobendas (Madrid), viven en un unifamiliar de la calle X y número Y de ese municipio y veranean en un adosado de la calle X y número Y de, por ejemplo, Torrevieja (Alicante)? ¿Sigue realmente siendo anónima esa persona, por mucho que Alcobendas y Torrevieja tengan más de 15.000 habitantes?

No parece que para ahorrar costes el medio ideal sea poder llegar a vulnerar un derecho capital como la privacidad

Por otro lado, y pese a las declaraciones anteriores del propio INE, lo que se pretende es realizar un perfilado de nuestros desplazamientos que va mucho más allá del perfilado digital que los algoritmos de mil tipos nos hacen en línea. Esto sería un perfilado físico, un perfilado a partir de nuestros movimientos físicos, en el 'mundo real'. Desde este punto de vista, pues, el proyecto es altamente intrusivo, máxime cuando caben alternativas apreciablemente precisas y mucho menos lesivas de la privacidad (como tomar datos a partir de ciertas zonas o de los propios medios de transporte). La intrusividad se incrementa, evidentemente, al incluir el domicilio en la toma de datos, siendo como se sabe la esfera más sagrada de la intimidad personal: “My home is my castle”, dicen los anglosajones.

Con este estudio, el INE terminaría sabiendo demasiado. Dice buscar así ahorrar costes, si bien no parece que el medio ideal para ese fin sea el de poder llegar a vulnerar un derecho capital como la privacidad, para colmo, de un número potencialmente muy grande de personas. Si decidieran seguir adelante con este proyecto, tanto el INE como las operadoras debieran empezar por informar 'inequívoca' y formalmente a los ciudadanos, y no por la prensa, de algo que aún no está claro, como es, entre otras cosas, y exactamente, qué datos se quieren compartir; sus leyes sectoriales obligan, de hecho, a hacerlo a estas empresas. Aunque, visto lo aquí dicho, lo que unos y otros deberían hacer es desechar cuanto antes esta iniciativa y tratar de alcanzar estos objetivos por un medio más respetuoso con la libertad.

*Pablo García Mexía es 'of counsel' de Derecho de Internet y TIC en Ashurst.

Tribuna
Escribe un comentario... Respondiendo al comentario #1
1comentario
Por FechaMejor Valorados
Mostrar más comentarios