« Outils pour la constitution de ressources » : différence entre les versions
Aller à la navigation
Aller à la recherche
Aucun résumé des modifications |
Aucun résumé des modifications |
||
Ligne 1 : | Ligne 1 : | ||
Cet article regroupe et synthétise des ressources pour l'outillage des langues à corpus restreint, dans le but de mieux les étudier, mais aussi de mieux développer des ressources numériques pour les locuteurs de ces langues. Les développeuses et développeurs du numérique sont incités à synthétiser ici en termes compréhensibles pour les communautés parlantes leurs nécessités en terme de corpus et d'outils numériques. | Cet article regroupe et synthétise des ressources pour l'outillage des langues à corpus restreint, dans le but de mieux les étudier, mais aussi de mieux développer des ressources numériques pour les locuteurs de ces langues. Les développeuses et développeurs du numérique sont incités à synthétiser ici en termes compréhensibles pour les communautés parlantes leurs nécessités en terme de corpus et d'outils numériques. | ||
== | == Logiciels de gestion de corpus == | ||
* Schmidt T & K. Wörner. 2014. 'EXMARaLDA', ''Handbook on Corpus Phonology'', Oxford University Press, 402-419. https://exmaralda.org/en/about-exmaralda/ | * Schmidt T & K. Wörner. 2014. 'EXMARaLDA', ''Handbook on Corpus Phonology'', Oxford University Press, 402-419. https://exmaralda.org/en/about-exmaralda/ | ||
: système pour travailler avec des corpus oraux numériques, comprenant un outil de transcription et d'annotation (Partitur-Editor), un outil de gestion de corpus (Corpus-Manager) un outil de requête et d'analyse (EXAKT). | : système pour travailler avec des corpus oraux numériques, comprenant un outil de transcription et d'annotation (Partitur-Editor), un outil de gestion de corpus (Corpus-Manager) un outil de requête et d'analyse (EXAKT). | ||
== Juridique et formulaires de consentement == | |||
* André-Poyaud, Isabelle, Sandrine Astor, Olivier Baude, Fabrice Boudjaaba, Gaëlle Bujan, Béatrice Collignon, Frédéric Dubois, Emmanuel Kessous, Lionel Maurel & Muriel Roger. 2019. ''Les sciences humaines et sociales et la protection des données à caractère personnel dans le contexte de la science ouverte, GUIDE POUR LA RECHERCHE'', InSHS, [https://www.inshs.cnrs.fr/sites/institut_inshs/files/pdf/guide-rgpd_2.pdf texte]. | |||
Version du 14 novembre 2023 à 17:57
Cet article regroupe et synthétise des ressources pour l'outillage des langues à corpus restreint, dans le but de mieux les étudier, mais aussi de mieux développer des ressources numériques pour les locuteurs de ces langues. Les développeuses et développeurs du numérique sont incités à synthétiser ici en termes compréhensibles pour les communautés parlantes leurs nécessités en terme de corpus et d'outils numériques.
Logiciels de gestion de corpus
- Schmidt T & K. Wörner. 2014. 'EXMARaLDA', Handbook on Corpus Phonology, Oxford University Press, 402-419. https://exmaralda.org/en/about-exmaralda/
- système pour travailler avec des corpus oraux numériques, comprenant un outil de transcription et d'annotation (Partitur-Editor), un outil de gestion de corpus (Corpus-Manager) un outil de requête et d'analyse (EXAKT).
Juridique et formulaires de consentement
- André-Poyaud, Isabelle, Sandrine Astor, Olivier Baude, Fabrice Boudjaaba, Gaëlle Bujan, Béatrice Collignon, Frédéric Dubois, Emmanuel Kessous, Lionel Maurel & Muriel Roger. 2019. Les sciences humaines et sociales et la protection des données à caractère personnel dans le contexte de la science ouverte, GUIDE POUR LA RECHERCHE, InSHS, texte.
Projets
- Jouitteau, Mélanie & Loic Grobol. à venir. création d'une mélangeuse de corpus pour l'augmentation de ressources pour les traducteurs automatiques.
Cours en ligne, auto-formation
- Jouitteau, Mélanie & Lynda Kehli. 2023. Langues minorisées à corpus restreint : partager pour survivre, Callisto-DoRANum-Disciplines, Inist, IKER-CNRS, cours en ligne. DOI : 10.13143/g6rw-eb28.
- MOOC développé avec DORANUM pour la science ouverte, pour expliquer clairement les bases de la constitution de corpus pour le développement numérique
Bibliographie
- Jouitteau, Mélanie. 2023. 'Guide de survie des langues minorisées à l’heure de l’intelligence artificielle : Appel aux communautés parlantes', Lapurdum, texte.
- Jouitteau, M. 2023. 'Community Internally-driven Corpus Buildings. Three Examples from the Breton Ecosystem', Proc. 2nd Annual Meeting of the ELRA/ISCA SIG on Under-resourced Languages (SIGUL 2023), 103-107, doi: 10.21437/SIGUL.2023-22.