« Recherche universitaire » : différence entre les versions

De Entrelangues
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Aucun résumé des modifications
 
(19 versions intermédiaires par 3 utilisateurs non affichées)
Ligne 1 : Ligne 1 :
== Transversaux ==


* [[Présentation|Entrelangues]], plate-forme de ressources sur les langues de l'État français
: Informations sur la vitalité, la sociologie et la linguistique, ainsi que sur les ressources de développement en traitement automatique.
: Avec Mélanie Jouitteau ([https://iker.cnrs.fr/ IKER, CNRS], UMR 5478, Centre de recherche sur la langue et les textes basques), Sylvain Kahane, Loic Grobol ([https://modyco.fr/ MoDyCo], Modèles, Dynamiques, Corpus, Université Paris Nanterre, UMR 7114).
* [https://gdr-lift.loria.fr/ GDR LIFT] (Linguistique Informatique, Formelle et de Terrain) :
: Met en contact linguistes formels et spécialistes du TAL avec un séminaire en ligne mensuel, que l'on peut suivre sur demande. Les langues à corpus restreint sont parfois présentes, et au-delà la question de la traitabilité IA des corpus restreints (problématiques d'acquisition du langage et des langues de spécialité).
* [https://adele.hypotheses.org/ ADELE]: Réseau Archives Documentation rEcherche Langues de FrancE
: Met en réseau les experts sur les langues de France dans différents domaines des sciences humaines et de la documentation, avec un séminaire en ligne régulier.
== Projets TAL concernant des langues à corpus restreint ==


* [https://autogramm.github.io/ ANR AUTOGRAMM] (2022-2026).  
* [https://autogramm.github.io/ ANR AUTOGRAMM] (2022-2026).  
: [Projet-ANR-21-CE38-0017]
: [Projet-ANR-21-CE38-0017]
: Induction de grammaires descriptives à partir de corpus annotés, [https://anr.fr/Projet-ANR-21-CE38-0017 résumé du projet].
: Induction de grammaires descriptives à partir de corpus annotés, [https://anr.fr/Projet-ANR-21-CE38-0017 résumé du projet].
: Avec le coordinateur Sylvain Kahane
: le [[breton]] fait partie des langues concernées, avec la construction d'un treebank (corpus UD).
: Avec le coordinateur Sylvain Kahane (MoDyCo, Modèles, Dynamiques, Corpus, Université Paris Nanterre, UMR 7114).


* [https://divital.gitpages.huma-num.fr/fr/ ANR DIVITAL] (2022-).
* [https://divital.gitpages.huma-num.fr/fr/ ANR DIVITAL] (2022-).
: [Projet-ANR-21-CE27-0004]
: [Projet-ANR-21-CE27-0004]
: Accroître la vitalité et la visibilité de plusieurs langues de France : l’[[alsacien]], le [[corse]], l'[[occitan]] et le [[poitevin-saintongeais]], [https://anr.fr/Projet-ANR-21-CE27-0004 résumé de projet]
: Accroître la vitalité et la visibilité de plusieurs langues de France : l'[[alsacien]], le [[corse]], l'[[occitan]] et le [[poitevin-saintongeais]], [https://anr.fr/Projet-ANR-21-CE27-0004 résumé de projet]
: Avec La coordinatrice Delphine Berhard de LiLPa (Linguistique, Langues et Parole), le CLLE (Cognition, Langues, Langage, Ergonomie), le FoReLLIS (Formes et Représentations en Linguistique, Littérature et dans les arts de l’Image et de la Scène), le LISA (Lieux, Identités, eSpaces et Activités)
: Avec La coordinatrice Delphine Berhard de LiLPa (Linguistique, Langues et Parole), le CLLE (Cognition, Langues, Langage, Ergonomie), le FoReLLIS (Formes et Représentations en Linguistique, Littérature et dans les arts de l'Image et de la Scène), le LISA (Lieux, Identités, eSpaces et Activités)
 
* [https://anr.fr/Projet-ANR-21-CE38-0006 ANR DALiH] (mars 2022 - sept 2026)
: Numérisation du patrimoine linguistique [[arménien]] : corpus multivarié arménien et traitement des données
: avec Victoria Khurshudyan ([https://sedyl.cnrs.fr/presentation/ Structure et Dynamique des Langues])  


* [[Présentation|Entrelangues]], plate-forme sur les langues de l'État français
* [https://anr.fr/Projet-ANR-20-CE27-0015 ANR SALTA] (mars 2021 - mars 2025)
: Informations sur la vitalité, la sociologie et la linguistique, ainsi que sur les ressources de développement en traitement automatique.
: Approche typologique des asymétries spatiales à travers les langues  
: parmi les langues de l'enquête, quelques-unes de l'État français (langues kanak et polynésiennes, avec Claire Moyse-Faurie, [[LSF]] mentionnée)
: Avec Benjamin Fagard
 
* L'[https://anr.fr/Project-ANR-22-CE38-0016 ANR SignToKids] (2022-2025), dirigée par  Sylvie Gibet (Université Bretagne Sud), développe avec le Modyco des outils numériques pédagogiques pour la [[LSF]].  


* ANR TraLaLam (1er octobre 2023-).  
* ANR TraLaLam (octobre 2023-).  
: Explorer la capacité de traduction des grands modèles de langues, en focalisant notamment sur les langues qui sont à la fois peu dotées et proches des langues bien dotées incluses dans les données d'entraînement.
: Explorer la capacité de traduction des grands modèles de langues, en focalisant notamment sur les langues qui sont à la fois peu dotées et proches des langues bien dotées incluses dans les données d'entraînement.
: Avec la coordinatrice Rachel Bawden (INRIA), Benoît Sagot (INRIA), François Yvon (CNRS), [https://www.systransoft.com/fr/lp/traduction-en-ligne/ Systran] ([https://dblp.org/pid/94/361.html Josep Crego] et Stanislas Assier de Pompignan).
: Avec la coordinatrice Rachel Bawden (INRIA), Benoît Sagot (INRIA), François Yvon (CNRS), [https://www.systransoft.com/fr/lp/traduction-en-ligne/ Systran] ([https://dblp.org/pid/94/361.html Josep Crego] et Stanislas Assier de Pompignan).


* ANR COLaF (2023-2027)
* Défi Inria COLaF (2023-2027)
: Avec l’équipe [https://www.inria.fr/en/multispeech Multispeech] (INRIA, CNRS, LORIA) pour le traitement de la parole et l'équipe [https://almanach.inria.fr/index-fr.html ALMAnaCH de l'INRIA] pour le texte.
: Avec l'équipe [https://www.inria.fr/en/multispeech Multispeech] (INRIA, CNRS, LORIA) pour le traitement de la parole et l'équipe [https://almanach.inria.fr/index-fr.html ALMAnaCH de l'INRIA] pour le texte.
 
* [https://anr.fr/Projet-ANR-17-CE27-0001 ANR CROISSANT] (2017-2021)
: projet porté par Nicolas Quint, ''Le Croissant linguistique : une approche multidisciplinaire du contact oc-oïl'', avec développement de corpus numériques.
: [[marchois]], [[bourbonnais d'oc]]
 
* [http://parcolab.univ-tlse2.fr/parcolaf/ Parcolaf] (2017-)
: textes alignés multilingues occitan, français, anglais, serbe

Dernière version du 5 octobre 2024 à 14:11

Transversaux

  • Entrelangues, plate-forme de ressources sur les langues de l'État français
Informations sur la vitalité, la sociologie et la linguistique, ainsi que sur les ressources de développement en traitement automatique.
Avec Mélanie Jouitteau (IKER, CNRS, UMR 5478, Centre de recherche sur la langue et les textes basques), Sylvain Kahane, Loic Grobol (MoDyCo, Modèles, Dynamiques, Corpus, Université Paris Nanterre, UMR 7114).
  • GDR LIFT (Linguistique Informatique, Formelle et de Terrain) :
Met en contact linguistes formels et spécialistes du TAL avec un séminaire en ligne mensuel, que l'on peut suivre sur demande. Les langues à corpus restreint sont parfois présentes, et au-delà la question de la traitabilité IA des corpus restreints (problématiques d'acquisition du langage et des langues de spécialité).
  • ADELE: Réseau Archives Documentation rEcherche Langues de FrancE
Met en réseau les experts sur les langues de France dans différents domaines des sciences humaines et de la documentation, avec un séminaire en ligne régulier.


Projets TAL concernant des langues à corpus restreint

[Projet-ANR-21-CE38-0017]
Induction de grammaires descriptives à partir de corpus annotés, résumé du projet.
le breton fait partie des langues concernées, avec la construction d'un treebank (corpus UD).
Avec le coordinateur Sylvain Kahane (MoDyCo, Modèles, Dynamiques, Corpus, Université Paris Nanterre, UMR 7114).
[Projet-ANR-21-CE27-0004]
Accroître la vitalité et la visibilité de plusieurs langues de France : l'alsacien, le corse, l'occitan et le poitevin-saintongeais, résumé de projet
Avec La coordinatrice Delphine Berhard de LiLPa (Linguistique, Langues et Parole), le CLLE (Cognition, Langues, Langage, Ergonomie), le FoReLLIS (Formes et Représentations en Linguistique, Littérature et dans les arts de l'Image et de la Scène), le LISA (Lieux, Identités, eSpaces et Activités)
Numérisation du patrimoine linguistique arménien : corpus multivarié arménien et traitement des données
avec Victoria Khurshudyan (Structure et Dynamique des Langues)
Approche typologique des asymétries spatiales à travers les langues
parmi les langues de l'enquête, quelques-unes de l'État français (langues kanak et polynésiennes, avec Claire Moyse-Faurie, LSF mentionnée)
Avec Benjamin Fagard
  • L'ANR SignToKids (2022-2025), dirigée par Sylvie Gibet (Université Bretagne Sud), développe avec le Modyco des outils numériques pédagogiques pour la LSF.
  • ANR TraLaLam (octobre 2023-).
Explorer la capacité de traduction des grands modèles de langues, en focalisant notamment sur les langues qui sont à la fois peu dotées et proches des langues bien dotées incluses dans les données d'entraînement.
Avec la coordinatrice Rachel Bawden (INRIA), Benoît Sagot (INRIA), François Yvon (CNRS), Systran (Josep Crego et Stanislas Assier de Pompignan).
  • Défi Inria COLaF (2023-2027)
Avec l'équipe Multispeech (INRIA, CNRS, LORIA) pour le traitement de la parole et l'équipe ALMAnaCH de l'INRIA pour le texte.
projet porté par Nicolas Quint, Le Croissant linguistique : une approche multidisciplinaire du contact oc-oïl, avec développement de corpus numériques.
marchois, bourbonnais d'oc
textes alignés multilingues occitan, français, anglais, serbe