OSIRIS

Observatoire sur les systèmes d’information, les réseaux et les inforoutes au Sénégal

Show navigation Hide navigation
  • OSIRIS
    • Objectifs
    • Partenaires
  • Ressources
    • Société de l’Information
    • Politique nationale
    • Législation et réglementation
    • Etudes et recherches
    • Points de vue
  • Articles de presse
  • Chiffres clés
    • Le Sénégal numérique
    • Principaux tarifs
    • Principaux indicateurs
  • Opportunités
    • Projets

Accueil > Articles de presse > Année 2025 > Septembre 2025 > Perte de sens dans la traduction : Comment l’Afrique tente de combler le (…)

Perte de sens dans la traduction : Comment l’Afrique tente de combler le fossé linguistique de l’IA

lundi 8 septembre 2025

Intelligence artificielle

Bien que l’Afrique abrite une grande partie des langues du monde (bien plus d’un quart selon certaines estimations), beaucoup d’entre elles sont absentes du développement de l’IA. Cela s’explique à la fois par un manque d’investissement et par le manque de données facilement accessibles. La plupart des outils d’IA utilisés aujourd’hui, tels que Chat GPT, sont entraînés en anglais ainsi que dans d’autres langues européennes et chinoises. Ces langues disposent d’une grande quantité de textes en ligne sur lesquels s’appuyer. Mais comme de nombreuses langues africaines sont principalement parlées et non écrites, il manque des textes pour entraîner l’IA afin de la rendre utile aux locuteurs de ces langues.

Pour des millions de personnes à travers le continent, cela signifie être laissées pour compte. Les chercheurs qui se sont penchés sur cette question ont récemment publié ce qui semble être le plus grand ensemble de données connu sur les langues africaines. « Nous pensons dans nos propres langues, nous rêvons dans nos langues et nous interprétons le monde à travers nos langues. Si la technologie ne reflète pas cela, tout un groupe risque d’être laissé pour compte », explique à la BBC le professeur Vukosi Marivathe de l’université de Pretoria, qui a travaillé sur le projet. « Nous vivons actuellement une révolution de l’IA et imaginons tout ce qu’elle peut nous apporter. Imaginez maintenant qu’une partie de la population n’y ait tout simplement pas accès parce que toutes les informations sont en anglais. »

Le projet Africa Next Voices a réuni des linguistes et des informaticiens afin de créer des ensembles de données prêts pour l’IA dans 18 langues africaines. Cela ne représente peut-être qu’une petite partie des plus de 2 000 langues qui seraient parlées sur le continent, mais les participants au projet affirment qu’ils espèrent s’étendre à l’avenir. En deux ans, l’équipe a enregistré 9 000 heures de conversations au Kenya, au Nigeria et en Afrique du Sud, capturant des scénarios quotidiens dans les domaines de l’agriculture, de la santé et de l’éducation. Les langues enregistrées comprenaient le kikuyu et le dholuo au Kenya, le haoussa et le yoruba au Nigeria et l’isiZulu et le tshivenda en Afrique du Sud, dont certaines sont parlées par des millions de personnes.

« Il faut une base de départ, et c’est ce qu’offre Africa Next Voices. Les gens pourront ensuite s’appuyer sur cette base et y ajouter leurs propres innovations », explique le professeur Marivathe, qui a dirigé les recherches en Afrique du Sud. Sa collègue kenyane, la linguiste computationnelle Lilian Wanzare, explique qu’enregistrer les discours sur le continent signifiait créer des données visant à refléter la façon dont les gens vivent et parlent réellement. « Nous avons recueilli des voix provenant de différentes régions, tranches d’âge et origines afin d’être aussi inclusifs que possible. Les grandes entreprises technologiques ne peuvent pas toujours percevoir ces nuances », explique-t-elle. Le projet a été rendu possible grâce à une subvention de 2,2 millions de dollars (1,6 million de livres sterling) de la Fondation Gates. Les données seront en libre accès, ce qui permettra aux développeurs de créer des outils qui traduisent, transcrient et répondent dans les langues africaines. Selon le professeur Marivathe, il existe déjà de petits exemples montrant comment les langues indigènes utilisées dans l’IA peuvent être utilisées pour résoudre des problèmes concrets en Afrique.

L’agricultrice Kelebogile Mosime gère un site de 21 hectares à Rustenburg, au cœur de la région platine d’Afrique du Sud.
Âgée de 45 ans, elle travaille avec une petite équipe pour cultiver des rangées de légumes, notamment des haricots, des épinards, des choux-fleurs et des tomates. Elle a commencé il y a seulement trois ans, avec une culture de choux, et pour l’aider, elle utilise une application appelée AI-Farmer, qui reconnaît plusieurs langues sud-africaines, dont le sesotho, l’isiZulu et l’afrikaans, afin de l’aider à résoudre divers problèmes. « En tant que personne qui apprend encore à cultiver, vous êtes confronté à de nombreux défis », explique Mme Mosime. « Chaque jour, je constate les avantages de pouvoir utiliser ma langue maternelle, le setswana, sur l’application lorsque je rencontre des problèmes à la ferme. Je pose toutes mes questions et j’obtiens des réponses utiles. » « Pour quelqu’un qui vit dans une zone rurale comme moi et qui n’est pas exposé à la technologie, c’est très utile. Je peux poser des questions sur les différentes options de lutte contre les insectes, et cela m’a également aidée à diagnostiquer les plantes malades », explique-t-elle, rayonnante sous son chapeau à large bord.

Lelapa AI est une jeune entreprise sud-africaine qui développe des outils d’IA en langues africaines pour les banques et les entreprises de télécommunications. Pour sa PDG, Pelonomi Moiloa, les outils actuellement disponibles sont très restrictifs.
« L’anglais est la langue des opportunités. Pour de nombreux Sud-Africains qui ne le parlent pas, ce n’est pas seulement un inconvénient, cela peut aussi signifier passer à côté de services essentiels tels que les soins de santé, les services bancaires ou même l’aide gouvernementale », explique-t-elle à la BBC. « La langue peut être un obstacle majeur. Nous pensons que cela ne devrait pas être le cas. » Mais il ne s’agit pas seulement d’une question d’affaires et de commodité.
Pour le professeur Marivathe, il existe également un risque que, sans initiatives en faveur des langues africaines, quelque chose d’autre puisse être perdu. « La langue est un accès à l’imagination », dit-il. « Ce ne sont pas seulement des mots, c’est l’histoire, la culture, le savoir. Si les langues indigènes ne sont pas incluses, nous perdons plus que des données, nous perdons des façons de voir et de comprendre le monde. »

(Source : BBC Afrique, 8 septembre 2025)

Un message, un commentaire ?

Qui êtes-vous ?
Votre message

Pour créer des paragraphes, laissez simplement des lignes vides.

Fil d'actu

  • TIC ET AGRICULTURE AU BURKINA FASO Étude sur les pratiques et les usages Burkina NTIC (9 avril 2025)
  • Sortie de promotion DPP 2025 en Afrique de l’Ouest Burkina NTIC (12 mars 2025)
  • Nos étudiant-es DPP cuvée 2024 tous-tes diplomés-es de la Graduate Intitute de Genève Burkina NTIC (12 mars 2025)
  • Retour sur images Yam Pukri en 2023 Burkina NTIC (7 mai 2024)
  • Quelles différences entre un don et un cadeau ? Burkina NTIC (22 avril 2024)

Liens intéressants

  • NIC Sénégal
  • ISOC Sénégal
  • Autorité de régulation des télécommunications et des postes (ARTP)
  • Fonds de Développement du Service Universel des Télécommunications (FDSUT)
  • Commission de protection des données personnelles (CDP)
  • Conseil national de régulation de l’audiovisuel (CNRA)
  • Sénégal numérique (SENUM SA)

Navigation par mots clés

  • 4279/4689 Régulation des télécoms
  • 346/4689 Télécentres/Cybercentres
  • 3321/4689 Economie numérique
  • 1697/4689 Politique nationale
  • 4684/4689 Fintech
  • 547/4689 Noms de domaine
  • 1694/4689 Produits et services
  • 1459/4689 Faits divers/Contentieux
  • 772/4689 Nouveau site web
  • 4689/4689 Infrastructures
  • 1670/4689 TIC pour l’éducation
  • 183/4689 Recherche
  • 241/4689 Projet
  • 3098/4689 Cybersécurité/Cybercriminalité
  • 1734/4689 Sonatel/Orange
  • 1566/4689 Licences de télécommunications
  • 263/4689 Sudatel/Expresso
  • 955/4689 Régulation des médias
  • 1233/4689 Applications
  • 1012/4689 Mouvements sociaux
  • 1569/4689 Données personnelles
  • 151/4689 Big Data/Données ouvertes
  • 590/4689 Mouvement consumériste
  • 358/4689 Médias
  • 642/4689 Appels internationaux entrants
  • 1687/4689 Formation
  • 96/4689 Logiciel libre
  • 1915/4689 Politiques africaines
  • 949/4689 Fiscalité
  • 166/4689 Art et culture
  • 570/4689 Genre
  • 1541/4689 Point de vue
  • 969/4689 Commerce électronique
  • 1576/4689 Manifestation
  • 312/4689 Presse en ligne
  • 127/4689 Piratage
  • 204/4689 Téléservices
  • 925/4689 Biométrie/Identité numérique
  • 302/4689 Environnement/Santé
  • 318/4689 Législation/Réglementation
  • 335/4689 Gouvernance
  • 1734/4689 Portrait/Entretien
  • 144/4689 Radio
  • 689/4689 TIC pour la santé
  • 269/4689 Propriété intellectuelle
  • 58/4689 Langues/Localisation
  • 1013/4689 Médias/Réseaux sociaux
  • 1950/4689 Téléphonie
  • 190/4689 Désengagement de l’Etat
  • 979/4689 Internet
  • 114/4689 Collectivités locales
  • 381/4689 Dédouanement électronique
  • 1041/4689 Usages et comportements
  • 1026/4689 Télévision/Radio numérique terrestre
  • 550/4689 Audiovisuel
  • 2941/4689 Transformation digitale
  • 382/4689 Affaire Global Voice
  • 152/4689 Géomatique/Géolocalisation
  • 341/4689 Service universel
  • 660/4689 Sentel/Tigo
  • 174/4689 Vie politique
  • 1507/4689 Distinction/Nomination
  • 34/4689 Handicapés
  • 689/4689 Enseignement à distance
  • 703/4689 Contenus numériques
  • 584/4689 Gestion de l’ARTP
  • 178/4689 Radios communautaires
  • 1684/4689 Qualité de service
  • 423/4689 Privatisation/Libéralisation
  • 132/4689 SMSI
  • 465/4689 Fracture numérique/Solidarité numérique
  • 2628/4689 Innovation/Entreprenariat
  • 1310/4689 Liberté d’expression/Censure de l’Internet
  • 46/4689 Internet des objets
  • 170/4689 Free Sénégal
  • 423/4689 Intelligence artificielle
  • 197/4689 Editorial
  • 22/4689 Yas

2025 OSIRIS
Plan du site - Archives (Batik)

Suivez-vous