« Desseigne & al. (2018) » : différence entre les versions

De Entrelangues
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
 
(Une version intermédiaire par le même utilisateur non affichée)
Ligne 1 : Ligne 1 :
* Desseigne, Adrien, Loïc Cheveau & Pierre-Yves Kersulec. 2013-2018. ''Banque Sonore des Dialectes Bretons, projet de documentation multimédia en ligne'', [http://banque.sonore.breton.free.fr/index.html site]. CC BY-NC-ND 3.0.  
* Desseigne, Adrien, Loïc Cheveau & Pierre-Yves Kersulec. 2013-2018. ''Banque Sonore des Dialectes Bretons, projet de documentation multimédia en ligne'', [http://banque.sonore.breton.free.fr/index.html site]. CC BY-NC-ND 3.0.  


: L'[https://huggingface.co/datasets/Bretagne/Banque_Sonore_Dialectes_Bretons extraction] de la base de données contient 7 291 paires audio-transcription, totalisant '''18h30''' heures, publiées sous licence CC BY-NC-ND 3.0.
: L'[https://huggingface.co/datasets/Bretagne/Banque_Sonore_Dialectes_Bretons extraction] de la base de données contient 7 291 paires audio-transcription, totalisant '''18h30''' heures, publiées sous licence CC BY-NC-ND 3.0.




== Qualité ==
== Description qualitative ==


Il s'agit d'enregistrements d'enquêtes linguistiques ou culturelles réalisés par 19 collecteurs bénévoles auprès de locuteurs de dialectes traditionnels du breton, sur une période d'une dizaine d'années.  
Il s'agit d'enregistrements d'enquêtes linguistiques ou culturelles réalisés par 19 collecteurs bénévoles auprès de locuteurs de dialectes traditionnels du breton, sur une période d'une dizaine d'années.  

Dernière version du 28 octobre 2025 à 09:01

  • Desseigne, Adrien, Loïc Cheveau & Pierre-Yves Kersulec. 2013-2018. Banque Sonore des Dialectes Bretons, projet de documentation multimédia en ligne, site. CC BY-NC-ND 3.0.


L'extraction de la base de données contient 7 291 paires audio-transcription, totalisant 18h30 heures, publiées sous licence CC BY-NC-ND 3.0.


Description qualitative

Il s'agit d'enregistrements d'enquêtes linguistiques ou culturelles réalisés par 19 collecteurs bénévoles auprès de locuteurs de dialectes traditionnels du breton, sur une période d'une dizaine d'années.

Un sous-ensemble de ces huit collecteurs a fourni deux transcriptions pour chaque enregistrement : une dans une orthographe locale proche de la prononciation, et une autre version standardisée en orthographe peurunvan. Cette dernière version visait à faciliter l'accès aux lecteurs originaires du breton standard ou du "breton littéraire".

Selon les transcripteurs et la distance linguistique entre le dialecte enregistré et le breton standard, cette standardisation peut aller d'une simple réécriture dans l'orthographe peurunvan à une traduction complète dans un dialecte linguistiquement différent, avec substitution d'item lexicaux pour d'autres. Il est difficile d'estimer précisément la quantité de "traduction" dans les transcriptions en peurunvan. Certaines phrases n'ont nécessité aucune "traduction" et sont juste des rétablissements de syllabes élidées, ou de particules fonctionnelles comme les déterminants, les particules aspectuelles o ou les rannigs a et e'.