twitter facebook rss
Imprimer Texte plus petit Texte plus grand

Les données numériques « anonymisées » peuvent être facilement identifiées, selon une étude

mercredi 1er septembre 2021

Qu’elles soient biométriques, personnelles ou médicales, rendre anonymes les données d’identification des internautes ne servirait à rien. Une récente étude américaine et européenne démontre que tous les systèmes qui ont été mis en place pour protéger notre vie privée numérique sont facilement contournables et permettent de ré-identifier les utilisateurs.

Sale temps pour le Règlement général de la protection des données (RGPD) européen, qui, en principe encadre strictement l’usage, la vente ou le transfert de nos données personnelles vers des sociétés commerciales ou des agences publicitaires en ligne. Celles concernant l’état de santé sont systématiquement « anonymisées » avant de pouvoir être partagées ou vendues à des tiers.

Ce traitement informatique des données de santé, rendu obligatoire par la législation européenne, consiste à retirer des bases de données de l’établissement de santé tous les noms et adresses, ainsi que substituer le numéro de l’assuré social par une suite de chiffres aléatoires pour empêcher de les identifier facilement. En milieu hospitalier, par exemple.

Ré-identification facile à partir de données « anonymisées »

Une fois « anonymes », ces données ne sont alors plus considérées comme personnelles, échappant ainsi aux régimes de protections du RGPD. Mais toutes ces procédures pour protéger l’anonymat seraient vaines en Europe, affirment des chercheurs de l’Université catholique de Louvain et de l’Imperial College de Londres, dans une étude publiée dans Nature.

Ils ont établi une méthode pour parvenir à une ré-identification des individus, sans recourir à une quelconque technique de piratage informatique. Les chercheurs ont mis au point un programme d’intelligence artificielle capable de recouper et classer par critères les informations d’un individu parmi des milliers d’autres. Le programme peut alors estimer, avec une grande précision, si les données ré-identifiées appartiennent bien à la bonne personne ou non.

Testé aux États-Unis, les résultats sont impressionnants : le genre, la date de naissance et le code postal ont suffi au logiciel à identifier formellement 83% des américains dont les données avaient pourtant été rendues anonymes. L’un des chercheurs de cette étude explique pourquoi ces critères permettent une identification précise et rapide : « Beaucoup de personnes vivant à New York sont des hommes et ont la trentaine. Parmi eux, beaucoup moins sont également nés le 5 janvier, conduisent une voiture de sport rouge, ont deux enfants et un chien ».

Près de 100 % d’identification en regroupant des critères

Plus les critères qualifiants les personnes sont nombreux, plus il devient facile de réaliser cette identification. Le taux de réussite monte quasiment à 100 % à partir de 15 critères sociaux-démographiques comme l’âge, le genre, le lieu, le métier, la nationalité et bien d’autres décrivant le statut social des individus. Des informations somme toute plutôt standard, que les entreprises du numérique demandent régulièrement.

Les chercheurs ont également créé un outil en ligne, qui n’enregistre aucune donnée et ne sert que de démonstration, pour aider les utilisateurs à comprendre quelles caractéristiques les rend uniques dans les bases de données du monde. Cette méthode d’identification serait déjà employée par les géants de la Tech américaine - des firmes dont les appétits d’ogres pour nos données personnelles et actuellement de santé ne sont plus vraiment à démontrer.

Dominique Desaunay

(Source : RFI, 1er septembre 2021)

Inscrivez-vous a BATIK

Inscrivez-vous à notre newsletter et recevez toutes nos actualités par email.

Navigation par mots clés

INTERNET EN CHIFFRES

- Bande passante internationale : 172 Gbps
- 4 FAI (Orange, Arc Télécom, Waw Télécom et Africa Access)
- 19 266 179 abonnés Internet

  • 18 595 500 abonnés 2G+3G+4G (96,58%)
    • 2G : 12,95%
    • 3G : 24,60%
    • 4G : 62,45%
  • 334 642 abonnés ADSL/Fibre (1,71%)
  • 334 875 clés et box Internet (1,71%)
  • 1162 abonnés aux 4 FAI
  • Internet fixe : 1,74%
  • Internet mobile : 98,26%

- Liaisons louées : 3971

- Taux de pénétration des services Internet : 106,84%

(ARTP, 30 septembre 2023)

- Débit moyen de connexion mobile : 23, 10 Mbps
- Débit moyen de connexion fixe : 21, 77 Mbps

(Ookla, 31 janvier 2023)


- 9 749 527 utilisateurs
- Taux de pénétration : 56,70%
(Internet World Stats 31 décembre 2021)


- + de 10 000 noms de domaine actifs en .sn
(NIC Sénégal, décembre 2023)

TÉLÉPHONIE EN CHIFFRES


Téléphonie fixe

- 3 opérateurs : Sonatel, Expresso et Saga Africa Holdings Limited
- 382 721 abonnés
- 336 817 résidentiels (88,01%)
- 45 904 professionnels (11,99%)
- Taux de pénétration : 1,67%

(ARTP, 30 septembre 2023)

Téléphonie mobile

- 3 opérateurs (Orange, Free et Expresso)
- 21 889 688 abonnés
- Taux de pénétration : 123,34%

(ARTP, 30 septembre 2023)

FACEBOOK

3 050 000 utilisateurs

Taux de pénétration : 17,4%

- Facebook : 2 600 000

- Facebook Messenger : 675 200

- Instagram : 931 500

- LinkedIn : 930 000

- Twitter : 300 000

(Datareportal, Janvier 2023)

PRÉSENTATION D’OSIRIS

batik