« Recherche universitaire » : différence entre les versions
Aller à la navigation
Aller à la recherche
Aucun résumé des modifications |
|||
| (9 versions intermédiaires par le même utilisateur non affichées) | |||
| Ligne 1 : | Ligne 1 : | ||
== Transversaux == | == Transversaux == | ||
* [[ | * [[Centre de ressources sur les langues de l'État français|Entrelangues]], plate-forme de ressources sur les langues de l'État français | ||
: Informations sur la vitalité, la sociologie et la linguistique, ainsi que sur les ressources de développement en traitement automatique. | : Informations sur la vitalité, la sociologie et la linguistique, ainsi que sur les ressources de développement en traitement automatique. | ||
: Avec Mélanie Jouitteau ([https://iker.cnrs.fr/ IKER, CNRS], UMR 5478, Centre de recherche sur la langue et les textes basques), Sylvain Kahane, Loic Grobol ([https://modyco.fr/ MoDyCo], Modèles, Dynamiques, Corpus, Université Paris Nanterre, UMR 7114). | : Avec Mélanie Jouitteau ([https://iker.cnrs.fr/ IKER, CNRS], UMR 5478, Centre de recherche sur la langue et les textes basques), Sylvain Kahane, Loic Grobol ([https://modyco.fr/ MoDyCo], Modèles, Dynamiques, Corpus, Université Paris Nanterre, UMR 7114). | ||
| Ligne 11 : | Ligne 11 : | ||
: Met en réseau les experts sur les langues de France dans différents domaines des sciences humaines et de la documentation, avec un séminaire en ligne régulier. | : Met en réseau les experts sur les langues de France dans différents domaines des sciences humaines et de la documentation, avec un séminaire en ligne régulier. | ||
* [https://www.culture.gouv.fr/thematiques/portail-langues-en-france Portail Langues en France] du Ministère de la Culture | |||
: Le projet, piloté par le ministère de la Culture en lien avec le CNRS, vise à documenter la diversité linguistique en France. Il s'adressera en premier lieu au grand public mais pourra intéresser le monde de la recherche comme les décideurs publics. Son accès est pour l'instant restreint au ministère. | |||
== Projets de linguistique == | |||
* [https://heliceo.huma-num.fr/ Hélicéo] sur les langues océaniennes en bilinguisme avec le français sur la Polynésie française, Wallis et Futuna, Nouvelle-Calédonie, Vanuatu. | |||
: Démarrage avril 2025 et sur 5 ans. | |||
: 3 millions d'euros décerné par repérage du INSHS, hors appel à projets. Dans le cadre de "France 2030", pour ce programme (RI)² le CNRS a fait remonter par ses instituts des vœux de projets par ailleurs non finançables par les appels européens ou l'ANR. | |||
== Projets TAL concernant des langues à corpus restreint == | == Projets TAL concernant des langues à corpus restreint == | ||
| Ligne 24 : | Ligne 33 : | ||
: Accroître la vitalité et la visibilité de plusieurs langues de France : l'[[alsacien]], le [[corse]], l'[[occitan]] et le [[poitevin-saintongeais]], [https://anr.fr/Projet-ANR-21-CE27-0004 résumé de projet] | : Accroître la vitalité et la visibilité de plusieurs langues de France : l'[[alsacien]], le [[corse]], l'[[occitan]] et le [[poitevin-saintongeais]], [https://anr.fr/Projet-ANR-21-CE27-0004 résumé de projet] | ||
: Avec La coordinatrice Delphine Berhard de LiLPa (Linguistique, Langues et Parole), le CLLE (Cognition, Langues, Langage, Ergonomie), le FoReLLIS (Formes et Représentations en Linguistique, Littérature et dans les arts de l'Image et de la Scène), le LISA (Lieux, Identités, eSpaces et Activités) | : Avec La coordinatrice Delphine Berhard de LiLPa (Linguistique, Langues et Parole), le CLLE (Cognition, Langues, Langage, Ergonomie), le FoReLLIS (Formes et Représentations en Linguistique, Littérature et dans les arts de l'Image et de la Scène), le LISA (Lieux, Identités, eSpaces et Activités) | ||
* Le [https://anr.fr/Projet-ANR-23-CE38-0004 Diversité des Langues Sinitiques et Humanités Numériques – DLS-HN] (November 2023 - 42 Mois) dirigé par Pierre Magistry explore le traitement automatique du [[teochew parisien]] et le hokkien de Taïwan. | |||
* [https://anr.fr/Projet-ANR-21-CE38-0006 ANR DALiH] (mars 2022 - sept 2026) | * [https://anr.fr/Projet-ANR-21-CE38-0006 ANR DALiH] (mars 2022 - sept 2026) | ||
Dernière version du 27 octobre 2025 à 08:47
Transversaux
- Entrelangues, plate-forme de ressources sur les langues de l'État français
- Informations sur la vitalité, la sociologie et la linguistique, ainsi que sur les ressources de développement en traitement automatique.
- Avec Mélanie Jouitteau (IKER, CNRS, UMR 5478, Centre de recherche sur la langue et les textes basques), Sylvain Kahane, Loic Grobol (MoDyCo, Modèles, Dynamiques, Corpus, Université Paris Nanterre, UMR 7114).
- GDR LIFT (Linguistique Informatique, Formelle et de Terrain) :
- Met en contact linguistes formels et spécialistes du TAL avec un séminaire en ligne mensuel, que l'on peut suivre sur demande. Les langues à corpus restreint sont parfois présentes, et au-delà la question de la traitabilité IA des corpus restreints (problématiques d'acquisition du langage et des langues de spécialité).
- ADELE: Réseau Archives Documentation rEcherche Langues de FrancE
- Met en réseau les experts sur les langues de France dans différents domaines des sciences humaines et de la documentation, avec un séminaire en ligne régulier.
- Portail Langues en France du Ministère de la Culture
- Le projet, piloté par le ministère de la Culture en lien avec le CNRS, vise à documenter la diversité linguistique en France. Il s'adressera en premier lieu au grand public mais pourra intéresser le monde de la recherche comme les décideurs publics. Son accès est pour l'instant restreint au ministère.
Projets de linguistique
- Hélicéo sur les langues océaniennes en bilinguisme avec le français sur la Polynésie française, Wallis et Futuna, Nouvelle-Calédonie, Vanuatu.
- Démarrage avril 2025 et sur 5 ans.
- 3 millions d'euros décerné par repérage du INSHS, hors appel à projets. Dans le cadre de "France 2030", pour ce programme (RI)² le CNRS a fait remonter par ses instituts des vœux de projets par ailleurs non finançables par les appels européens ou l'ANR.
Projets TAL concernant des langues à corpus restreint
- ANR AUTOGRAMM (2022-2026).
- [Projet-ANR-21-CE38-0017]
- Induction de grammaires descriptives à partir de corpus annotés, résumé du projet.
- le breton fait partie des langues concernées, avec la construction d'un treebank (corpus UD).
- Avec le coordinateur Sylvain Kahane (MoDyCo, Modèles, Dynamiques, Corpus, Université Paris Nanterre, UMR 7114).
- ANR DIVITAL (2022-).
- [Projet-ANR-21-CE27-0004]
- Accroître la vitalité et la visibilité de plusieurs langues de France : l'alsacien, le corse, l'occitan et le poitevin-saintongeais, résumé de projet
- Avec La coordinatrice Delphine Berhard de LiLPa (Linguistique, Langues et Parole), le CLLE (Cognition, Langues, Langage, Ergonomie), le FoReLLIS (Formes et Représentations en Linguistique, Littérature et dans les arts de l'Image et de la Scène), le LISA (Lieux, Identités, eSpaces et Activités)
- Le Diversité des Langues Sinitiques et Humanités Numériques – DLS-HN (November 2023 - 42 Mois) dirigé par Pierre Magistry explore le traitement automatique du teochew parisien et le hokkien de Taïwan.
- ANR DALiH (mars 2022 - sept 2026)
- Numérisation du patrimoine linguistique arménien : corpus multivarié arménien et traitement des données
- avec Victoria Khurshudyan (Structure et Dynamique des Langues)
- ANR SALTA (mars 2021 - mars 2025)
- Approche typologique des asymétries spatiales à travers les langues
- parmi les langues de l'enquête, quelques-unes de l'État français (langues kanak et polynésiennes, avec Claire Moyse-Faurie, LSF mentionnée)
- Avec Benjamin Fagard
- L'ANR SignToKids (2022-2025), dirigée par Sylvie Gibet (Université Bretagne Sud), développe avec le Modyco des outils numériques pédagogiques pour la LSF.
- ANR TraLaLam (octobre 2023-).
- Explorer la capacité de traduction des grands modèles de langues, en focalisant notamment sur les langues qui sont à la fois peu dotées et proches des langues bien dotées incluses dans les données d'entraînement.
- Avec la coordinatrice Rachel Bawden (INRIA), Benoît Sagot (INRIA), François Yvon (CNRS), Systran (Josep Crego et Stanislas Assier de Pompignan).
- Défi Inria COLaF (2023-2027)
- Avec l'équipe Multispeech (INRIA, CNRS, LORIA) pour le traitement de la parole et l'équipe ALMAnaCH de l'INRIA pour le texte.
- ANR CROISSANT (2017-2021)
- projet porté par Nicolas Quint, Le Croissant linguistique : une approche multidisciplinaire du contact oc-oïl, avec développement de corpus numériques.
- marchois, bourbonnais d'oc
- Parcolaf (2017-)
- textes alignés multilingues occitan, français, anglais, serbe
- RESTAURE (2014)
- L'objectif du projet ANR RESTAURE était de fournir des ressources numériques (corpus annotés et lexiques) et des outils de traitement du langage naturel pour trois langues régionales de France : l'alsacien, l'occitan et le picard.
- Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur - Orsay ; Centre d’études des relations et des contacts linguistiques et littéraires - Laboratoire Linguistique Et Sociolinguistique : Contacts, Lexique, Appropriations, Politiques - Amiens ; Cognition Langues Langage Ergonomie – Équipe de Recherche en Syntaxe et Sémantique – Toulouse ; Linguistique, Langues, Parole - Université de Strasbourg (France)