Nouveaux projets visant à promouvoir des ensembles de données langagières élaborés localement en Afrique

Le Lacuna Fund annonce sa deuxième cohorte de projets soutenus dont les équipes vont créer des ensembles de données textuelles et vocales librement accessibles qui alimenteront les technologies de traitement des langues naturelles (TLN) pour 29 langues, aux quatre coins de l’Afrique.

Les bénéficiaires du financement produiront des ensembles de données de formation en Afrique orientale, occidentale et australe qui répondront à une série de besoins concernant des langues pour lesquelles il y a peu de ressources. Ces besoins comprennent la traduction automatique, la reconnaissance vocale, la reconnaissance d’entités nommées, le balisage de parties du discours, l’analyse de sentiments et les ensembles de données multimodales. Tous les ensembles de données seront élaborés et détenus localement, et seront librement accessibles à la communauté internationale des données.

« En Afrique du Sud, le gouvernement utilise des robots conversationnels pour fournir des mises à jour quotidiennes sur la covid-19 », explique Vukosi Marivate, titulaire de la chaire Absa en science des données à l’Université de Pretoria. « À l’heure actuelle, il est très facile de traduire ces mises à jour vers les langues latines, mais les ensembles de données nécessaires pour les traduire vers diverses langues africaines n’existent pas, ce qui signifie que le gouvernement n’est pas en mesure de communiquer avec un grand nombre de ses citoyens dans leur langue maternelle. C’est l’un des nombreux exemples qui montrent pourquoi nous avons besoin de ce travail maintenant », a-t-il déclaré.

Pour de plus amples renseignements sur les projets sélectionnés, veuillez consulter le site http://www.lacunafund.org.

À propos du Lacuna Fund :

Le Lacuna Fund est la première initiative participative au monde qui vise à fournir aux scientifiques spécialistes des données, aux chercheurs et aux entrepreneurs sociaux, dans des pays à revenu faible ou moyen, les ressources dont ils ont besoin pour produire des ensembles de données de formation qui répondent aux problèmes urgents de leurs collectivités. Ce fonds est né d’une collaboration entre la Fondation Rockefeller, Google.org et le CRDI, avec le soutien de l’Agence allemande de coopération internationale pour le de développement (GIZ), au nom du ministère fédéral allemand de la Coopération économique et du Développement (BMZ). Il s’est depuis transformé en un engagement multipartite composé d’experts techniques, de leaders d’opinion, de bénéficiaires locaux et d’utilisateurs finaux. Le Lacuna Fund est déterminé à créer et à mobiliser des ensembles de données de formation qui résolvent des problèmes locaux urgents et permettent de faire évoluer le potentiel de l’apprentissage machine dans le monde entier.