Recherche universitaire
- ANR AUTOGRAMM (2022-2026).
- [Projet-ANR-21-CE38-0017]
- Induction de grammaires descriptives à partir de corpus annotés, résumé du projet.
- Avec le coordinateur Sylvain Kahane (MoDyCo, Modèles, Dynamiques, Corpus, Université Paris Nanterre, UMR 7114).
- ANR DIVITAL (2022-).
- [Projet-ANR-21-CE27-0004]
- Accroître la vitalité et la visibilité de plusieurs langues de France : l’alsacien, le corse, l'occitan et le poitevin-saintongeais, résumé de projet
- Avec La coordinatrice Delphine Berhard de LiLPa (Linguistique, Langues et Parole), le CLLE (Cognition, Langues, Langage, Ergonomie), le FoReLLIS (Formes et Représentations en Linguistique, Littérature et dans les arts de l’Image et de la Scène), le LISA (Lieux, Identités, eSpaces et Activités)
- Entrelangues, plate-forme sur les langues de l'État français
- Informations sur la vitalité, la sociologie et la linguistique, ainsi que sur les ressources de développement en traitement automatique.
- Avec Mélanie Jouitteau (IKER, CNRS, UMR 5478, Centre de recherche sur la langue et les textes basques), Sylvain Kahane, Loic Grobol, Christophe Parisse (MoDyCo, Modèles, Dynamiques, Corpus, Université Paris Nanterre, UMR 7114).
- ANR TraLaLam (1er octobre 2023-).
- Explorer la capacité de traduction des grands modèles de langues, en focalisant notamment sur les langues qui sont à la fois peu dotées et proches des langues bien dotées incluses dans les données d'entraînement.
- Avec la coordinatrice Rachel Bawden (INRIA), Benoît Sagot (INRIA), François Yvon (CNRS), Systran (Josep Crego et Stanislas Assier de Pompignan).
- Défi Inria COLaF (2023-2027)
- Avec l’équipe Multispeech (INRIA, CNRS, LORIA) pour le traitement de la parole et l'équipe ALMAnaCH de l'INRIA pour le texte.
- ANR CROISSANT (2017-2021)
- projet porté par Nicolas Quint, Le Croissant linguistique : une approche multidisciplinaire du contact oc-oïl, avec développement de corpus numériques.
- marchois, bourbonnais d'oc