OSIRIS

Observatoire sur les systèmes d’information, les réseaux et les inforoutes au Sénégal

Show navigation Hide navigation
  • OSIRIS
    • Objectifs
    • Partenaires
  • Ressources
    • Société de l’Information
    • Politique nationale
    • Législation et réglementation
    • Etudes et recherches
    • Points de vue
  • Articles de presse
  • Chiffres clés
    • Le Sénégal numérique
    • Principaux tarifs
    • Principaux indicateurs
  • Opportunités
    • Projets

Accueil > Articles de presse > Archives 1999-2024 > Année 2023 > Janvier 2023 > Kenya : premiers remous pour ChatGPT

Kenya : premiers remous pour ChatGPT

vendredi 27 janvier 2023

Contenus numériques

Depuis quelques temps ChatGPT secoue l’écosystème numérique. Dans ce vent de succès, ChatGPT vient de vivre sa première zone de turbulences au Kenya.

Dans le monde de l’intelligence artificielle, ChatGPT occupe l’actualité depuis novembre 2022. Mais la trouvaille qui fait tant parler vit ses premiers soubresauts. Selon une enquête du magazine Time décrit par le biais d’un prestataire établi en Afrique, OpenAI aurait entraîné son modèle en demandant à des salariés sous-payés d’étiqueter des milliers de textes atroces. Réagissant à cette information, l’accusé indique que « sa mission est de s’assurer que l’intelligence artificielle générale profite à toute l’Humanité ».

Mais l’enquête donne une toute autre version. Le journal révèle que « l’entreprise a eu recours aux services d’une entreprise, Sama, afin d’ « apprendre » à ChatGPT ne pas répondre à ses utilisateurs de façon toxique ou violente. Le siège de Sama, qui a aussi pour clients Google, Microsoft ou la Nasa, est à San Francisco… Mais les dizaines d’employés qui ont travaillé sur ChatGPT habitent loin, très loin de la Silicon Valley », indique-t-il.

Ce sont en effet des travailleurs kenyans de Sama, payés selon Time entre 1,20 et 2 euros de l’heure, qui ont réalisé le « sale boulot » qui nous permet aujourd’hui d’utiliser ChatGPT sans que le bot se perde dans des délires toxiques, racistes, violents.

Analyse de mots piochés sur le web

Dans le détail, l’article revient avec insistance sur le calvaire des travailleurs. « Pour bien comprendre ce que ces travailleurs payés une misère ont dû endurer, il faut d’abord expliquer rapidement comment ChatGPT est entraîné, et la technique d’OpenAI pour l’empêcher de générer un discours toxique. L’intelligence du bot vient de la collecte et de l’analyse de milliards d’ensembles de mots piochés sur le Web. Une somme qui, bien entendu, comporte aussi une quantité considérable de ce que les échanges humains produisent de pire… et qui se retrouvent dans le modèle, une fois ce dernier entraîné », lit-on dans l’article.

Étant presque dans l’impossibilité de vérifier ces éléments « à la main », l’OpenAi a alors décidé d’intégrer à ChatGPT un mécanisme de protection, une sorte d’IA « gendarme » entraînée par des humains, capable de limiter les discours toxiques générés par le modèle. Pour cela, il faut la « nourrir » d’autres types de textes bien spécifiques : des discours haineux, sexuellement explicites, violents, toxiques… Pire, les « étiqueteurs » de Sama que Time a pu interviewer ont dit avoir eu à décrire pour la machine entre 150 et 250 passages de ce genre par jour, comportant de 100 à 1000 mots à raison de 9 heures de travail quotidien.

Sama évoque de son côté un chiffre plus bas, d’environ 70 contenus par jour. Qu’importe : la violence psychologique d’un tel travail peut être traumatisante. Un employé interrogé par le magazine parle même de « torture » en se remémorant avoir eu à étiqueter par exemple un contenu décrivant « un homme ayant des relations sexuelles avec un chien en présence d’un enfant ». Le calvaire ne s’arrête pas là.

Une collecte d’images inquiétante

Au-delà de l’étiquetage de textes violents, OpenAI a passé un autre contrat avec Sama, qui a conduit à la fin précipitée de leur collaboration. En février 2022, le créateur de ChatGPT demande à son prestataire de collecter « des images sexuelles et violentes » pour un autre de ses projets, une « étape nécessaire pour rendre ses outils plus sûrs ». La firme s’est exécutée et a collecté 1 400 images, dont des clichés clairement illégaux, parmi lesquels des images de violences sexuelles sur enfants, de viols, de meurtres… Une collecte qui a rapidement inquiété la branche africaine, et mené à la fin précoce d’un contrat qui devait encore durer huit mois.

Aujourd’hui, l’affaire continue de secouer l’écosystème et les accusés se renvoient la balle. Même si elle n’a pas encore révélé tous ses secrets, cette affaire garde un aspect sombre. C’est d’autant plus problématique que la main d’œuvre employée à cette tâche est à la fois mal rémunérée et très peu suivie psychologiquement. Un comble, quand les entreprises qui les emploient -toujours très discrètement – pèsent plusieurs dizaines de milliards de dollars. Pour rappel, OpenAI serait déjà valorisée 29 milliards de dollars.

Mamadou Diop

(Source : CIO Mag, 27 janvier 2022)

Fil d'actu

  • TIC ET AGRICULTURE AU BURKINA FASO Étude sur les pratiques et les usages Burkina NTIC (9 avril 2025)
  • Sortie de promotion DPP 2025 en Afrique de l’Ouest Burkina NTIC (12 mars 2025)
  • Nos étudiant-es DPP cuvée 2024 tous-tes diplomés-es de la Graduate Intitute de Genève Burkina NTIC (12 mars 2025)
  • Retour sur images Yam Pukri en 2023 Burkina NTIC (7 mai 2024)
  • Quelles différences entre un don et un cadeau ? Burkina NTIC (22 avril 2024)

Liens intéressants

  • NIC Sénégal
  • ISOC Sénégal
  • Autorité de régulation des télécommunications et des postes (ARTP)
  • Fonds de Développement du Service Universel des Télécommunications (FDSUT)
  • Commission de protection des données personnelles (CDP)
  • Conseil national de régulation de l’audiovisuel (CNRA)
  • Sénégal numérique (SENUM SA)

Navigation par mots clés

  • 4394/4897 Régulation des télécoms
  • 353/4897 Télécentres/Cybercentres
  • 3328/4897 Economie numérique
  • 1767/4897 Politique nationale
  • 4897/4897 Fintech
  • 520/4897 Noms de domaine
  • 1750/4897 Produits et services
  • 1491/4897 Faits divers/Contentieux
  • 737/4897 Nouveau site web
  • 4687/4897 Infrastructures
  • 1763/4897 TIC pour l’éducation
  • 217/4897 Recherche
  • 250/4897 Projet
  • 3212/4897 Cybersécurité/Cybercriminalité
  • 1790/4897 Sonatel/Orange
  • 1581/4897 Licences de télécommunications
  • 269/4897 Sudatel/Expresso
  • 955/4897 Régulation des médias
  • 1228/4897 Applications
  • 1044/4897 Mouvements sociaux
  • 1611/4897 Données personnelles
  • 129/4897 Big Data/Données ouvertes
  • 602/4897 Mouvement consumériste
  • 363/4897 Médias
  • 671/4897 Appels internationaux entrants
  • 1567/4897 Formation
  • 94/4897 Logiciel libre
  • 2037/4897 Politiques africaines
  • 939/4897 Fiscalité
  • 167/4897 Art et culture
  • 578/4897 Genre
  • 1560/4897 Point de vue
  • 993/4897 Commerce électronique
  • 1564/4897 Manifestation
  • 329/4897 Presse en ligne
  • 128/4897 Piratage
  • 209/4897 Téléservices
  • 890/4897 Biométrie/Identité numérique
  • 308/4897 Environnement/Santé
  • 325/4897 Législation/Réglementation
  • 346/4897 Gouvernance
  • 1763/4897 Portrait/Entretien
  • 146/4897 Radio
  • 758/4897 TIC pour la santé
  • 278/4897 Propriété intellectuelle
  • 59/4897 Langues/Localisation
  • 1029/4897 Médias/Réseaux sociaux
  • 1913/4897 Téléphonie
  • 193/4897 Désengagement de l’Etat
  • 1023/4897 Internet
  • 136/4897 Collectivités locales
  • 429/4897 Dédouanement électronique
  • 1192/4897 Usages et comportements
  • 1046/4897 Télévision/Radio numérique terrestre
  • 569/4897 Audiovisuel
  • 3135/4897 Transformation digitale
  • 392/4897 Affaire Global Voice
  • 154/4897 Géomatique/Géolocalisation
  • 312/4897 Service universel
  • 674/4897 Sentel/Tigo
  • 179/4897 Vie politique
  • 1504/4897 Distinction/Nomination
  • 37/4897 Handicapés
  • 768/4897 Enseignement à distance
  • 854/4897 Contenus numériques
  • 614/4897 Gestion de l’ARTP
  • 193/4897 Radios communautaires
  • 1729/4897 Qualité de service
  • 439/4897 Privatisation/Libéralisation
  • 145/4897 SMSI
  • 476/4897 Fracture numérique/Solidarité numérique
  • 2829/4897 Innovation/Entreprenariat
  • 1360/4897 Liberté d’expression/Censure de l’Internet
  • 47/4897 Internet des objets
  • 172/4897 Free Sénégal
  • 617/4897 Intelligence artificielle
  • 198/4897 Editorial
  • 22/4897 Yas

2025 OSIRIS
Plan du site - Archives (Batik)

Suivez-vous