Los marcos legales en materia de protección de datos han ido evolucionando exponencialmente a lo largo de estos últimos años con la finalidad última de dotar a las entidades de una serie de pautas que salvaguarden los derechos y libertades de las personas.

Dentro de las múltiples medidas que pueden desplegarse, vamos a enfocarnos en los controles técnicos, pues tradicionalmente, cuando se necesitaba analizar y compartir datos, se aplicaban métidos de supresión, perturbación y generalización de atributos de los sujetos de los datos con el objetivo de desidentificarlos, es decir, incrementar la complejidad de vinculación con la persona, pero el avance de las tecnologías y, sobre todo, el incremento de la capacidad de cómputo y la disponibilidad de los datos, han generado nuevos riesgos que ponen en tela de juicio dichas herramientas, por lo que a consecuencia de ello se han desarrollado modelos formales.

La privacidad diferencial es una propiedad de un conjunto de datos basada en la inyección aleatoria de ruido que proporciona una garantía matemática formal sobre la desvinculación dato – persona.

Es decir, es una definición matemática en el contexto del análisis estadístico y de aprendizaje automático que busca impedir, por ejemplo, ataques de reidentificación o vinculación de registros, afianzando el principio de minimización de datos, puesto que la técnica asegura que no se van a revelar datos a sujetos no autorizados.

Hay que tener en cuenta que esta técnica de anonimización genera datos menos precisos y, por lo tanto, en función del objetivo de uso, puede no resultar útil. La privacidad diferencial puede ser útil, por ejemplo, para detectar anomalías o patrones generales dentro de los datos, hacer histogramas, consultas de recuento o clasificaciones con aprendizaje automático.

Un punto clave en el despliegue de esta técnica, es lo que se denomina “épsilon” -aunque también se le conoce como “presupuesto de privacidad” o “parámetro de privacidad”- y que determina el nivel de ruido añadido, es decir, es la cantidad de información que todavía puede inferirse de un individuo dentro del conjunto de datos, de modo que la finalidad consiste en impedir garantizar que la información relacionada con una persona específica esté presente en los datos.

Cada análisis ajustarse para proporcionar más o menos privacidad cambiando el valor de este parámetro.

Hay dos tipos de privacidad diferencial disponibles:

La privacidad diferencial global, que es la que agrega ruido durante el cálculo del resultado final antes de compartirlo con terceros, si bien su implementación implica que se debe acceder directamente a los datos en bruto reales. Como principales ventajas frente al siguiente, obtendríamos unos resultados más precisos y homogéneos al aplicar el mismo ruido a todo el conjunto.
La privacidad diferencial local, que es la que realiza cada uno de los sujetos respecto a sus datos, por lo que el ruido total y la complejidad es mucho mayor que en el caso anterior puesto que se aplica en capas varias veces ese mismo ruido. Ahora bien, a pesar de esto, el modelo local no se recomienda para producir información anónima, puesto que, a pesar de la configuración, se ha demostrado que cabe la posibilidad de vincular o asociar registros con los datos de la persona al no parametrizar de común acuerdo, si bien reduce netamente la inferencia de atributos.

Para elegir épsilon correctamente, debemos tener en consideración que cuanto más pequeño es su valor, más similar son las salidas, por lo que se proporciona mayor nivel de privacidad, de modo que cuanto más alto sea el valor de épsilon, menos ruido, resultando más fácil distinguir entre diferentes registros en la base de datos.

Por ejemplo, si el parámetro seleccionado es 0, el análisis imita perfectamente el escenario de exclusión voluntaria de cada individuo, pues no podríamos conocer ningún tipo de información, pero es implicaría ignorar toda la información de la entrada y, en consecuencia, no nos estaría podría proporcionando ningún resultado significativo. Sin embargo, si establecemos 0,1, la desviación entre el cómputo del conjunto real y el escenario de exclusión voluntaria de cada individuo será lo suficientemente pequeño como para brindar privacidad y, además, estadísticas útiles.

Po tanto, para evaluar cual es el parámetro a seleccionar, debemos tener en cuenta:

La finalidad u objetivo último del uso de los datos.
La naturaleza y tipología de la información y los atributos.
El tamaño de la población del conjunto de datos.
Tipo y número de consultas a realizar.

Una vez establecido, conviene realizar una fase de pruebas, analizando el nivel de riesgo al que se enfrentaría si, por ejemplo, un atacante realiza un número de consultas suficiente como para acumular conocimiento directo o inferido de una persona por sus resultados o las correlaciones de estos respecto a la disponible.

En definitiva, este tipo de herramientas de privacidad nos proporcionan sólidas ventajas respecto a las tradicionales, ya que no es necesario guardar el secreto en torno a los cálculos, por lo que permiten un acceso más amplio a los conjuntos de datos que, de otro modo, no se podrían compartir debido a problemas de privacidad.

Además, cuenta con la ventaja de que, si se puede demostrar que un cómputo es diferencialmente privado, podemos estar seguros de que el uso del cómputo no revelaría indebidamente información específica de un sujeto dentro del conjunto.

AUTORA: Alba Sánchez de la Calle
TWITTER: https://twitter.com/AlbusAlba

Cookie	Duración	Propiedad	Descripción
wordpress_logged_in_	Sesión	Wordpress	Después del login, WordPress activa la cookie wordpress_logged_in [hash], que indica cuando te has conectado y quién eres, siendo usado para la interfaz de WordPress.
wordpress_sec_	1 año	Wordpress	Estas cookies nos ayudan a mantenerte conectado a nuestro sitio.
wordpress_test_cookie	Sesión	Wordpress	Esta cookie se usa para que el gestor de contenidos WordPress compruebe si el navegador tiene las cookies activadas.
wfwaf-authcookie-	1 dia	Plugin Wordfence	Esta cookie es establecida por el plugin de seguridad de WordPress «Wordfence». Se utiliza para autenticar la solicitud de inicio de sesión del usuario.
woocommerce_recently_viewed	Sesión	WooCommerce	Para que funcione el widget de “visto recientemente”
woocommerce_cart_hash	Sesión	WooCommerce	Coookie que ayuda a detectar y guardar cambios en el carrito.
woocommerce_items_in_cart	Sesión	WooCommerce	Coookie que ayuda a detectar y guardar cambios en el carrito
wp_woocommerce_session_	2 días	WooCommerce	Añade un código único a cada cliente para poder identificar su carrito en la base de datos
cookielawinfo-checkbox-analytics	11 meses	Plugin GDPR /Webtofee	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. El propósito de esta cookie es verificar si el usuario ha dado su consentimiento para el uso de cookies en la categoría 'Analíticas'.
cookielawinfo-checkbox-necessary	11 meses	Plugin GDPR /Webtofee	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. El propósito de esta cookie es verificar si el usuario ha dado su consentimiento para el uso de cookies en la categoría 'Necesarias'.
cookielawinfo-checkbox-performance	11 meses	Plugin GDPR /Webtofee	Esta cookie está configurada por el complemento de consentimiento de cookies de GDPR. El propósito de esta cookie es verificar si el usuario ha dado su consentimiento para el uso de cookies en la categoría 'Rendimiento'.
cli_user_preference	Sesión	Plugin GDPR /Webtofee	Esta cookie es guardada por el plugin GDPR Cookie Consent y se utiliza para registrar si el usuario ha consentido o no el uso de cookies. No almacena ningún dato personal.
tk_ai	Sesión	WordPress Jetpack	Almacena un ID anónimo generado aleatoriamente. Esto solo se usa dentro del /wp-admin área del backoffice ( ) y se usa para el seguimiento del uso.
tinv_wishlistkey	1 mes	Worpress Woocomerce	Guadar los productos marcados como favoritos

Cookie	Tipo	Duración	Descripción
_ga	de terceros	2 años	La Web utiliza Google Analytics, un servicio analítico de Web prestado por Google, Inc., una compañía de Delaware cuya oficina principal está en 1600 Amphitheatre Parkway, Mountain View (California), CA 94043, Estados Unidos (“Google”). La información que genera la cookie acerca de su uso de la Web (incluyendo su dirección IP) será directamente transmitida y archivada por Google en los servidores de Estados Unidos. Google usará esta información por cuenta de Bidaidea con el propósito de seguir la pista de su uso de la Web, recopilando informes de actividad y prestando otros servicios relacionados con la actividad y el uso de Internet. Google no asociará su dirección IP con ningún otro dato del que disponga Google.
_gali	de terceros	30 segundos	Cookie instalada por Google Analytics, utilizada para obtener información acerca de la página que un usuario está visitando dentro del sitio web. Tiene una duración determinada por el tiempo que se pasa en una determinada entrada.
_gat	0	1 minuto	La cookie es instalada por Google Universal Analytics para acelerar la tasa de solicitud y limitar la recopilación de datos para webs con gran trafico. Se usa para limitar el porcentaje de solicitudes.
_gid	0	1 día	La Web utiliza Google Analytics, un servicio analítico de Web prestado por Google, Inc., una compañía de Delaware cuya oficina principal está en 1600 Amphitheatre Parkway, Mountain View (California), CA 94043, Estados Unidos (“Google”). La información que genera la cookie acerca de su uso de la Web (incluyendo su dirección IP) será directamente transmitida y archivada por Google en los servidores de Estados Unidos. Google usará esta información por cuenta de Bidaidea con el propósito de seguir la pista de su uso de la Web, recopilando informes de actividad y prestando otros servicios relacionados con la actividad y el uso de Internet. Google no asociará su dirección IP con ningún otro dato del que disponga Google.
audience	0	1 año
demdex	0	5 months	This cookie is set under the domain demdex.net and is used by Adobe Audience Manager to help identify a unique visitor across domains.
KRTBCOOKIE_188	0	5 months	Cookie de seguimiento basada en intereses de Pubmatic

Cookie	Tipo	Duración	Descripción
_cc_aud	0	8 months	The cookie is set by crwdcntrl.net. The purpose of the cookie is to collect statistical information in an anonymous form about the visitors of the website. The data collected include number of visits, average time spent on the website, and the what pages have been loaded. These data are then used to segment audiences based on the geographical location, demographic, and user interest provide relevant content and for advertisers for targeted advertising.
_cc_cc	0	8 months	The cookie is set by crwdcntrl.net. The purpose of the cookie is to collect statistical information in an anonymous form about the visitors of the website. The data collected include number of visits, average time spent on the website, and the what pages have been loaded. These data are then used to segment audiences based on the geographical location, demographic, and user interest provide relevant content and for advertisers for targeted advertising.
_cc_dc	0	8 months	The cookie is set by crwdcntrl.net. The purpose of the cookie is to collect statistical information in an anonymous form about the visitors of the website. The data collected include number of visits, average time spent on the website, and the what pages have been loaded. These data are then used to segment audiences based on the geographical location, demographic, and user interest provide relevant content and for advertisers for targeted advertising.
_cc_id	0	8 months	The cookie is set by crwdcntrl.net. The purpose of the cookie is to collect statistical information in an anonymous form about the visitors of the website. The data collected include number of visits, average time spent on the website, and the what pages have been loaded. These data are then used to segment audiences based on the geographical location, demographic, and user interest provide relevant content and for advertisers for targeted advertising.
_fbp	0	3 meses	Facebook configura esta cookie para enviar publicidad cuando están en Facebook o en una plataforma digital impulsada por publicidad de Facebook después de visitar este sitio web.
_kuid_	0	5 months	The cookie is set by Krux Digital under the domain krxd.net. The cookie stores a unique ID to identify a returning user for the purpose of targeted advertising.
dpm	0	5 months	The cookie is set by demdex.net. This cookie assigns a unique ID to each visiting user that allows third-party advertisers target that users with relevant ads.
fr	1	3 meses	Facebook configura la cookie para mostrar anuncios relevantes a los usuarios y medir y mejorar los anuncios. La cookie también rastrea el comportamiento del usuario en la web en sitios que tienen píxeles de Facebook o complementos sociales de Facebook.
IDE	1	2 años	Utilizado por Google DoubleClick y almacena información sobre cómo el usuario utiliza el sitio web y cualquier otro anuncio antes de visitar el sitio web. Se utiliza para presentar a los usuarios anuncios que son relevantes para ellos de acuerdo con el perfil del usuario.
PUBMDCID	0	3 months	This cookie is set by pubmatic.com. The cookie stores an ID that is used to display ads on the users' browser.
TapAd_DID	0	2 months	The cookie is set by tapad.com. The purpose of the cookie is to track users across devices to enable targeted advertising
TapAd_TS	0	2 months	The cookie is set by Tapad.com. The purpose of the cookie is to track users across devices to enable targeted advertising.
uid	0	2 months	This cookie is used to measure the number and behavior of the visitors to the website anonymously. The data includes the number of visits, average duration of the visit on the website, pages visited, etc. for the purpose of better understanding user preferences for targeted advertisments.
VISITOR_INFO1_LIVE	1	5 meses	Youtube establece esta cookie. Se utiliza para rastrear la información de los videos de YouTube incrustados en un sitio web.

Privacidad diferencial y anonimización de datos

Related Posts