Google et l’Université du Ghana collaborent sur le projet Euphonia pour améliorer la reconnaissance vocale des personnes ayant des modèles de parole non standard

Maria

Google et l'Université du Ghana collaborent sur le projet Euphonia pour améliorer la reconnaissance vocale des personnes ayant des modèles de parole non standard

Google Research Africa, l’Université du Ghana et le Global Disability Innovation Hub (GDI Hub) de l’UCL unissent leurs forces dans le cadre du projet Euphonia, une initiative de recherche innovante dédiée à l’amélioration de la technologie de reconnaissance vocale pour les personnes ayant des modèles de parole non standard.

Le projet vise à créer des modèles d’IA qui comprennent mieux et interprètent avec précision divers modèles de parole, en se concentrant sur les langues locales ghanéennes pour améliorer l’inclusivité dans la communication.

Lors d’une conférence technique et d’un événement de presse organisés à Google Ghana, les partenaires ont présenté les progrès du projet Euphonia, une initiative motivée par la mission visant à faire progresser la reconnaissance automatique de la parole (ASR) pour les locuteurs présentant des modèles de parole uniques résultant de conditions telles que la paralysie cérébrale, la SLA. , un accident vasculaire cérébral, le syndrome de Down ou la maladie de Parkinson.

Cet événement a souligné l’importance d’utiliser l’IA pour surmonter les obstacles réels à l’accessibilité et a annoncé des efforts de collecte de données à venir à travers le Ghana, où des orthophonistes locaux rassembleront des échantillons de voix en Akan, Ewe, Ikposo, Dagbani et Dagaare.

Le projet Euphonia cherche à combler le fossé que rencontrent de nombreux systèmes de reconnaissance vocale conventionnels lors du traitement de paroles non standard, ce qui entraîne souvent des limitations de communication.

En se concentrant sur les langues ghanéennes, le projet espère créer des modèles ASR qui répondent aux nuances linguistiques et aux modèles phonétiques de ces langues, rendant ainsi la technologie plus inclusive pour les Ghanéens ayant un langage non standard.

Cet effort de collaboration est alimenté par une subvention de 40 000 $ de Google et le soutien à la recherche du programme AT2030 du GDI Hub, qui fournit une expertise et des ressources pour développer des technologies d’IA adaptées aux communautés mal desservies.

Les scientifiques de Google Research travaillent en étroite collaboration avec des chercheurs et des étudiants de l’Université du Ghana, construisant des modèles de parole et créant un ensemble de données open source pour les langues ghanéennes, le premier du genre pour la parole non standard.
Katrin Tomanek, chercheuse scientifique principale chez Google Research, a déclaré : « La collaboration sur le projet Euphonia au Ghana nous permet de tirer parti de l’expertise locale pour rendre la technologie ASR plus inclusive pour tous. En soutenant la création du premier ensemble de données open source sur la parole non standard dans les langues ghanéennes, Google réaffirme son engagement en faveur de la recherche sur l’IA en Afrique, garantissant que les progrès technologiques profitent à tous.

Faisant écho à ce sentiment, le professeur Cathy Holloway, directrice académique du GDI Hub, a souligné l’importance de la diversité linguistique dans le développement de l’IA : « L’extension de la reconnaissance vocale basée sur l’IA à davantage de langues permet de garantir que les personnes ayant une parole non standard peuvent communiquer efficacement avec les autres et appareils. Cette collaboration améliorera non seulement l’accessibilité au Ghana, mais offrira également des perspectives pour le développement mondial de l’IA, ouvrant la voie à de futurs projets en Afrique et au-delà.

Le professeur Isaac Wiafe, chef de projet et professeur agrégé à l’Université du Ghana, a souligné la mission du projet : « Diriger cette initiative reflète notre engagement à utiliser la technologie pour relever les défis du monde réel. En développant des solutions d’IA localisées, nous pouvons garantir qu’un plus grand nombre de Ghanéens communiquent efficacement, quels que soient leurs modes de parole.
Le projet Euphonia s’inscrit dans le cadre de l’engagement plus large de Google visant à favoriser l’innovation en matière d’IA en Afrique.

Grâce au financement, à l’expertise technique et aux ressources de cloud computing, Google vise à responsabiliser les chercheurs locaux et à créer des solutions ayant un impact mondial considérable. Cette initiative s’appuie sur l’application Project Relate, qui continue d’améliorer la communication pour les personnes ayant un discours non standard dans le monde entier.

À mesure que le projet Euphonia progresse, les partenaires sont impatients d’étendre la technologie à d’autres langues et régions, afin de garantir que les avantages de l’IA inclusive atteignent les communautés du monde entier.