Lent & al. (2023)
Aller à la navigation
Aller à la recherche
- Lent, Heather, Kushal Tatariya, Raj Dabre, Yiyi Chen, Marcell Fekete, Esther Ploeger, Li Zhou, Hans Erik Heje, Diptesh Kanojia, Paul Belony, Marcel Bollmann, Loïc Grobol, Miryam de Lhoneux, Daniel Hershcovich, Michel DeGraff, Anders Søgaard & Johannes Bjerva. 2023. 'CreoleVal: Multilingual Multitask Benchmarks for Creoles', ArXiv:2310.19567. texte.
[traduction de résumé]: "Les créoles représentent un groupe de langues sous-exploré et marginalisé, avec peu de ressources disponibles pour la recherche en TAL. Si les liens généalogiques entre les créoles et d’autres langues riches en ressources impliquent un potentiel important d’apprentissage par transfert, ce potentiel reste entravé par ce manque de données annotées. Dans cet article, nous présentons CreoleVal, une collection d'ensembles de données de référence couvrant 8 tâches TAL différentes, et jusqu'à 28 langues créoles ; il s'agit d'un agrégat de tout nouveaux ensembles de données de développement pour la compréhension automatique, la classification des relations et la traduction automatique pour les créoles, ainsi qu'une passerelle pratique vers une poignée de benchmarks pré-existants. Pour chaque référence, nous menons des expériences de base en zéro-shot afin de mieux vérifier les capacités et les limites de l'apprentissage par transfert pour les créoles. À terme, l'objectif de CreoleVal est de renforcer la recherche sur les créoles en TAL et en linguistique computationnelle. Nous espérons que cette ressource contribuera à l’inclusion technologique des utilisateurs de la langue créole du monde entier."