Qu’est-ce que les données anonymisées ?

Publié le 26 novembre 2020

La protection de la vie privée est importante et cela passe inévitablement par la protection des données personnelles. En effet, dans le monde d’aujourd’hui, nous sommes amenés à communiquer nos informations aux différentes administrations, et nous les enregistrons également régulièrement sur Internet lorsque nous créons un compte sur un site marchand par exemple. Pour protéger les données personnelles, il existe une technique qui se nomme l’anonymisation des données. Un concept sur lequel il convient de s’arrêter afin de mieux en comprendre le principe et les enjeux.

Anonymisation des données : définition

L’anonymisation de données personnelles consiste à modifier leur contenu ou leur structure afin de rendre toute identification d’une personne (physique ou morale) impossible.

Ce processus vise à éliminer les possibilités de ré-identification.

L’anonymisation des données est de plus en plus exploitée depuis l’essor d’Internet, qui voit les personnes entrer leurs données personnelles de manière très régulière.

Les enjeux de l’anonymisation des données sont à la fois éthiques, juridiques, mais aussi informationnels et de bonne gouvernance.

Pourquoi anonymiser les données ?

L’anonymisation des données est une solution pour pouvoir utiliser les données de personnes tout en respectant leurs droits et leurs libertés. Cette technique permet aux acteurs qui souhaitent utiliser des données, les analyser, les publier, les partager et même les conserver au-delà de leur durée de conservation de la faire sans porter atteinte à la vie privée des personnes.

Comment anonymiser les données et comment en vérifier l’efficacité ?

On dénombre différentes techniques d’anonymisation des données, reposant sur des principes plus ou moins complexes. On note parmi ces techniques :

  • la suppression d’une information
  • la randomisation : c’est-à-dire la modification de certaines données afin qu’elles soient mois précises
  • la généralisation : elle consiste à modifier les données en utilisant un ordre de grandeur (par exemple mentionner un département au lieu d’une ville)
  • le traitement à l’aide d’un algorithme…

Afin d’évaluer si l’anonymisation des données est efficace, les acteurs qui souhaitent les exploiter doivent prendre en compte trois critères précis :

  • l’individualisation : peut-on encore isoler un individu ?
  • la corrélation : peut-on relier des données distinctes entre elles concernant un même individu permettant ainsi son identification ?
  • l’inférence : peut-on déduire de nouvelles informations sur un individu ?

La CNIL (Commission Nationale Informatique et Libertés) indique que les données ne peuvent pas être considérées comme anonymes lorsque l’un de ces trois critères n’est pas respecté. De ce fait, tous les acteurs qui souhaitent utiliser des données personnelles par le biais de l’anonymisation doivent être en mesure de prouver que le risque de ré-identification des individus est nul.

Attention également à effectuer une veille permanente afin de bien vérifier le caractère permanent de l’anonymisation des données. En effet, les techniques d’anonymisation et de ré-identification évoluent de manière très régulière dans le temps. C’est important car dans le cas où un jeu de données publié sur Internet comme anonyme laisse en réalité apparaître des données personnelles, il y a alors violation de ces dernières. Cela engendre l’obligation de retirer le jeu de données au plus vite, d’informer le CNIL s’il y a un risque pour les droits et libertés des personnes et d’informer les individus concernés lorsque le risque est de violation de données est élevé.

Bon à savoir : au moment de vouloir publier des informations personnelles et avant de pratiquer l’anonymisation des données, il peut-être opportun de voir si les exceptions mentionnées dans l’article L.312-1-2 du Code des relations entre le public et l’administration (CRPA) sont applicables à votre projet.

Share This