twitter facebook rss

Articles de presse

Imprimer Texte plus petit Texte plus grand

Les données numériques « anonymisées » peuvent être facilement identifiées, selon une étude

mercredi 1er septembre 2021

Qu’elles soient biométriques, personnelles ou médicales, rendre anonymes les données d’identification des internautes ne servirait à rien. Une récente étude américaine et européenne démontre que tous les systèmes qui ont été mis en place pour protéger notre vie privée numérique sont facilement contournables et permettent de ré-identifier les utilisateurs.

Sale temps pour le Règlement général de la protection des données (RGPD) européen, qui, en principe encadre strictement l’usage, la vente ou le transfert de nos données personnelles vers des sociétés commerciales ou des agences publicitaires en ligne. Celles concernant l’état de santé sont systématiquement « anonymisées » avant de pouvoir être partagées ou vendues à des tiers.

Ce traitement informatique des données de santé, rendu obligatoire par la législation européenne, consiste à retirer des bases de données de l’établissement de santé tous les noms et adresses, ainsi que substituer le numéro de l’assuré social par une suite de chiffres aléatoires pour empêcher de les identifier facilement. En milieu hospitalier, par exemple.

Ré-identification facile à partir de données « anonymisées »

Une fois « anonymes », ces données ne sont alors plus considérées comme personnelles, échappant ainsi aux régimes de protections du RGPD. Mais toutes ces procédures pour protéger l’anonymat seraient vaines en Europe, affirment des chercheurs de l’Université catholique de Louvain et de l’Imperial College de Londres, dans une étude publiée dans Nature.

Ils ont établi une méthode pour parvenir à une ré-identification des individus, sans recourir à une quelconque technique de piratage informatique. Les chercheurs ont mis au point un programme d’intelligence artificielle capable de recouper et classer par critères les informations d’un individu parmi des milliers d’autres. Le programme peut alors estimer, avec une grande précision, si les données ré-identifiées appartiennent bien à la bonne personne ou non.

Testé aux États-Unis, les résultats sont impressionnants : le genre, la date de naissance et le code postal ont suffi au logiciel à identifier formellement 83% des américains dont les données avaient pourtant été rendues anonymes. L’un des chercheurs de cette étude explique pourquoi ces critères permettent une identification précise et rapide : « Beaucoup de personnes vivant à New York sont des hommes et ont la trentaine. Parmi eux, beaucoup moins sont également nés le 5 janvier, conduisent une voiture de sport rouge, ont deux enfants et un chien ».

Près de 100 % d’identification en regroupant des critères

Plus les critères qualifiants les personnes sont nombreux, plus il devient facile de réaliser cette identification. Le taux de réussite monte quasiment à 100 % à partir de 15 critères sociaux-démographiques comme l’âge, le genre, le lieu, le métier, la nationalité et bien d’autres décrivant le statut social des individus. Des informations somme toute plutôt standard, que les entreprises du numérique demandent régulièrement.

Les chercheurs ont également créé un outil en ligne, qui n’enregistre aucune donnée et ne sert que de démonstration, pour aider les utilisateurs à comprendre quelles caractéristiques les rend uniques dans les bases de données du monde. Cette méthode d’identification serait déjà employée par les géants de la Tech américaine - des firmes dont les appétits d’ogres pour nos données personnelles et actuellement de santé ne sont plus vraiment à démontrer.

Dominique Desaunay

(Source : RFI, 1er septembre 2021)

BATIK

Inscrivez-vous a BATIK

Inscrivez-vous à notre newsletter et recevez toutes nos actualités par email.

Navigation par mots clés

INTERNET EN CHIFFRES

- Bande passante internationale : 172 Gbps
- 4 FAI (Orange, Arc Télécom, Waw Télécom et Africa Access)
- 15 418 058 abonnés Internet

  • 15 064 336 abonnés 2G+3G+4G (97,72%)
    • 2G : 21,30%
    • 3G : 39,18%
    • 4G : 39,52%
  • 195 457 abonnés ADSL/Fibre (1,28%)
  • 156 129 clés et box Internet (1,00% )
  • 2 136 abonnés aux 4 FAI (0,02%)
  • Internet fixe : 1,28%
  • Internet mobile : 98,72%

- Liaisons louées : 4 131

- Taux de pénétration des services Internet : 92,29%

(ARTP, 30 juin 2021)

- 9 749 527 utilisateurs
- Taux de pénétration : 58,20%

(Internet World Stats 31 décembre 2018)

- 6693 noms de domaine actifs en .sn

(NIC Sénégal, avril 2020)

TÉLÉPHONIE EN CHIFFRES


Téléphonie fixe

- 3 opérateurs : Sonatel, Expresso et Saga Africa Holdings Limited
- 252 221 abonnés
- 210 908 résidentiels (83,62%)
- 41 313 professionnels (16,38%)
- Taux de pénétration : 1,51%

(ARTP, 30 juin 2021)


Téléphonie mobile

- 3 opérateurs (Orange, Free et Expresso)
- 19 667 613 abonnés
- Taux de pénétration : 117,73%

(ARTP, 30 juin 2021)

FACEBOOK

3 900 000 utilisateurs

Taux de pénétration : 23%

- Facebook : 3,2 millions

- Instagram : 1,2 million

- LinkedIn : 680 000

- Twitter : 148 400

(Hootsuite, Février 2021)