Pour améliorer la représentation des langues africaines dans les systèmes d’Intelligence Artificielle (IA), Orange a annoncé la signature d’un partenariat avec OpenAI et Meta.
Le lancement du projet, prévu pour le premier semestre 2025, vise à développer des intelligences artificielles capables de reconnaître et d’interagir avec les langues africaines.
Les langues d’Afrique de l’Ouest, telles que le wolof et le pulaar, seront les premières à être intégrées dans le projet. Elles seront incorporées dans les technologies Whisper d’OpenAI et Llama de Meta, deux modèles d’IA spécialisés dans la reconnaissance et la traduction linguistique.
Les modèles d’IA actuels sont majoritairement formés avec des données en anglais, ce qui limite la prise en charge des langues africaines. En raison de la rareté des données disponibles, ces langues sont sous-représentées dans les bases de données utilisées pour entraîner les IA.
Pour y remédier, Orange fournira les données de ses applications locales, notamment dans les services clients, afin d’améliorer le traitement des langues africaines par les IA.
L’un des objectifs est de permettre aux utilisateurs d’Orange d’interagir avec le service client dans leur langue maternelle, rendant ainsi l’expérience utilisateur plus fluide et accessible.
Les progrès réalisés durant la collaboration ne bénéficieront pas seulement aux services d’Orange, puisque les modèles développés seront également mis à disposition pour des projets non commerciaux, notamment dans les secteurs de la santé publique et de l’éducation.
En parallèle, Orange a signé un accord avec OpenAI pour accéder directement aux derniers modèles d’intelligence artificielle du groupe, disposant d'un traitement et d'un hébergement des données en Europe.
A savoir que la Côte d'Ivoire est un pays classé parmi les pays à forte hétérogénéité linguistique avec environ une soixantaine de langues locales dont les plus importantes sont le dioula, le baoulé, le sénoufo et le bété.
Les langues d'origine africaine en Côte d'Ivoire appartiennent à quatre principaux groupes linguistiques : Akan et Krou dans le sud du pays, Mandé et Voltaïque dans le nord. Il y a 66 langues indigènes et un total de 112 langues. Le dioula (langue mandingue) est la principale langue utilisée pour le commerce et est utilisée à ces fins par 70 % de la population.