« Le Ferrand & al. (2023) » : différence entre les versions

De Entrelangues
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Aucun résumé des modifications
 
Ligne 1 : Ligne 1 :
* Le Ferrand, Eric, Claudel Pierre-Louis, Ruoran Dong, Benjamin Lecouteux, Daphné Gonçalves-Teixeira, et al. 2023. 'Outiller la documentation des langues créoles', ''LIFT 2023 : journées scientifiques du GdR Linguistique Informatique, Formelle et de Terrain'', Nov 2023, Vandoeuvre-Lès-Nancy, France. [https://hal.science/hal-04302623 texte].
* Le Ferrand, Eric, Claudel Pierre-Louis, Ruoran Dong, Benjamin Lecouteux, Daphné Gonçalves-Teixeira, et al. 2023. 'Outiller la documentation des langues créoles', ''LIFT 2023 : journées scientifiques du GdR Linguistique Informatique, Formelle et de Terrain'', Nov 2023, Vandoeuvre-Lès-Nancy, France. [https://hal.science/hal-04302623 texte].
: description d'une méthode de collecte constituant un corpus de texte aligné et de transcription. La locutrice enregistrée est traduite d'abord à l'oral par une autre personne native, dans une grande langue qui est ensuite automatiquement transcrite. Le dernier stade d'enrichissement est la transcription de l'audio original, mais il peut être fait en vue de sa traduction écrite.
: Cette méthode a un bon potentiel pour constituer un set de premiers corpus de qualité. 




[[Category:langues créoles|Categories]]
[[Category:langues créoles|Categories]]
[[Category:TAL|Categories]]
[[Category:TAL|Categories]]

Dernière version du 4 décembre 2023 à 16:50

  • Le Ferrand, Eric, Claudel Pierre-Louis, Ruoran Dong, Benjamin Lecouteux, Daphné Gonçalves-Teixeira, et al. 2023. 'Outiller la documentation des langues créoles', LIFT 2023 : journées scientifiques du GdR Linguistique Informatique, Formelle et de Terrain, Nov 2023, Vandoeuvre-Lès-Nancy, France. texte.


description d'une méthode de collecte constituant un corpus de texte aligné et de transcription. La locutrice enregistrée est traduite d'abord à l'oral par une autre personne native, dans une grande langue qui est ensuite automatiquement transcrite. Le dernier stade d'enrichissement est la transcription de l'audio original, mais il peut être fait en vue de sa traduction écrite.
Cette méthode a un bon potentiel pour constituer un set de premiers corpus de qualité.