AWA, l’IA qui parle votre langue : quand la tech donne une voix aux oubliés du numérique
mardi 1er juillet 2025
Dans un monde où l’intelligence artificielle redéfinit les usages, Alioune Badara Mbengue, jeune entrepreneur et fondateur de la startup Andakia, a choisi de relever un défi audacieux : faire parler les machines dans les langues africaines. En donnant naissance à AWA, une interface vocale intelligente capable de comprendre et de répondre en wolof – et bientôt en pulaar et haoussa –, il ne crée pas seulement une technologie innovante, il initie une révolution culturelle et sociale.
Avec une vision ancrée dans la souveraineté numérique africaine, Alioune entend briser les barrières linguistiques qui privent encore des millions d’Africains d’un accès équitable au numérique. À travers cet entretien exclusif, il revient sur les coulisses d’AWA, les défis techniques surmontés, les retours enthousiastes des utilisateurs, et sa volonté farouche de faire de l’IA un levier d’inclusion et d’émancipation. Une rencontre avec un visionnaire qui fait parler l’Afrique, dans toutes ses langues.
Quelle a été la motivation derrière le projet AWA ?
En 2015, nous avons conçu Mbal-it, une poubelle intelligente s’exprimant en langues nationales pour sensibiliser au tri sélectif. Cette expérience nous a révélé le fossé technologique concernant les interfaces vocales en langues africaines. Sachant que l’Afrique compte environ 2 000 langues et que des millions d’Africains s’expriment principalement dans leur langue maternelle, il était évident qu’une barrière linguistique entravait l’accès aux technologies. AWA est née de cette volonté de permettre une interaction naturelle avec les machines dans nos langues locales, tout en valorisant notre patrimoine culturel.
Quels sont les défis que vous avez rencontrés au niveau technique et linguistique ?
AWA, c’est un écosystème de plusieurs modules : reconnaissance vocale, LLM, voix de synthèse, etc. Chacun a ses propres défis. Par exemple, les données audio annotées disponibles en wolof sur internet ne dépassent même pas 100h au départ, alors qu’il en faut des milliers, par exemple Whisper, le système de reconnaissance vocale développé par OpenAI, a été entraîné sur un ensemble de données massif de 680 000 heures d’audio multilingue et multi tâche collecté sur le web. Il a donc fallu collecter, nettoyer et annoter des centaines d’heures supplémentaires. Pour le LLM, on a dû construire un corpus textuel solide, et pour la synthèse vocale, enregistrer plusieurs centaines d’heures de qualité en studio.
Au-delà des données, la langue elle-même pose des défis : différence entre wolof parlé et écrit, mots wolofisés, absence de norme claire… On travaille avec des linguistes, et même aujourd’hui certaines formulations font débat. Enfin, il y a la question de la puissance de calcul et de l’ingénierie nécessaire pour faire tourner tous ces modules ensemble, de façon fluide et optimisée, malgré un accès limité aux ressources comme les GPUs.
Concrètement, quels sont les cas d’usage d’AWA et ses bénéfices pour les populations ?
AWA se positionne comme une interface vocale entre les populations non lettrées et la technologie. Ce que l’IA ou le numérique offrent aujourd’hui à ceux qui maîtrisent le français, l’anglais ou le digital, AWA peut le rendre accessible à ceux qui ne savent ni lire ni écrire dans ces langues.
Les cas d’usage sont donc quasi infinis : – Une mère de famille peut poser une question sur la santé de son enfant et recevoir des conseils en wolof. – Un agriculteur peut demander la météo ou des conseils sur les semences. – Un jeune peut poser des questions sur l’orientation scolaire ou professionnelle.
Mais l’enjeu dépasse les services ponctuels : imaginons que l’État digitalise l’accès aux services administratifs (extrait de naissance, demande de papiers, etc.). Sans interface inclusive, des millions de citoyens resteraient exclus car incapables d’utiliser un formulaire en ligne. AWA lève cette barrière.
Enfin, chaque module d’AWA peut aussi servir indépendamment : – La transcription automatique du wolof pour archiver ou analyser du contenu oral, – La synthèse vocale pour rendre des services plus accessibles, – Le LLM ou notre moteur de recherche intégré pour extraire des infos depuis des bases de données locales, même en wolof.
AWA, c’est donc autant un pont vers la technologie qu’un levier d’inclusion sociale.
Comment les premiers utilisateurs ont-ils accueilli cette innovation ?
Nos premiers clients sont des entreprises privées qui utilisent certains modules d’AWA, notamment la transcription et l’analyse audio, pour traiter des milliers d’heures et produire des insights de qualité et en sont très satisfaites.
Par ailleurs, lors d’une phase de test sur Telegram, AWA a reçu un accueil incroyable. L’engouement a dépassé nos attentes : même ceux qui n’ont pas pu tester continuent de demander un accès. C’est devenu une vraie demande populaire. L’exposition médiatique autour d’AWA a renforcé cet effet, au point qu’elle est en train de devenir un véritable phénomène.
Quelles sont les prochaines étapes pour AWA et Andakia ?
Nous avons commencé avec le wolof, parlé par environ 10 à 15 millions de personnes entre le Sénégal et la Gambie. Mais pour maximiser l’impact d’AWA, il est essentiel de s’ouvrir aux autres grandes langues africaines.
Nous finalisons actuellement la disponibilité de tous les modules d’AWA en pulaar, une langue parlée par plus de 65 millions de locuteurs répartis dans au moins 13 pays, du Sénégal au Niger, en passant par la Guinée, le Mali, le Cameroun ou encore le Nigeria. C’est un défi technique et linguistique, car le pulaar se décline en plusieurs variantes régionales – Fouta-Tôro, Fouladou, Macina, Adamaoua, Fouta-Djalon, Borgou, etc. Nous veillons à ce que notre technologie s’adapte à cette richesse.
En parallèle, nous travaillons sur d’autres langues majeures comme le haoussa, parlé par environ 70 à 80 millions de personnes principalement au Nigeria, au Niger, au Tchad et au Cameroun, ce qui en fait l’une des langues les plus parlées du continent.
Notre objectif est clair : couvrir un maximum de locuteurs en Afrique pour que l’IA ne soit pas un privilège réservé aux élites francophones ou anglophones, mais un outil accessible à tous.
Notre API devient progressivement accessible à des entreprises, et nous collaborons avec plusieurs ONG et institutions pour déployer AWA dans des secteurs clés comme l’éducation, la santé ou l’administration locale.
Quel est votre regard sur le développement de l’intelligence artificielle en Afrique ?
Il y a un peu plus d’un an, j’ai publié un ouvrage intitulé Prospérité symbiotique – L’impératif de succès de la relation entre l’Afrique et l’intelligence artificielle. J’y développe une vision que je défends depuis plusieurs années : l’IA ne doit pas être simplement importée en Afrique, mais co-construite à partir de nos réalités.
C’est un enjeu de souveraineté. Nos langues, nos données, nos problématiques spécifiques doivent être au cœur de cette révolution. L’Afrique ne peut pas rester consommatrice passive de technologies conçues ailleurs. Il nous faut des modèles d’IA ancrés localement, capables de répondre à nos défis avec notre intelligence collective.
(Source : Social Net Link, 1er juillet 2025)