« Common Voice - Breton » : différence entre les versions

De Entrelangues
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
* Mozilla. 2023. ''Common Voice'', [https://commonvoice.mozilla.org/en/datasets datatsets en breton].
* Mozilla. 2023. ''Common Voice'', [https://commonvoice.mozilla.org/en/datasets datatsets en breton].
La distribution officielle inclut une division en train/dev/test après déduplication par phrase (si une même phrase a été enregistrée par deux personnes différentes, seul un de ces deux enregistrements apparaît), en conséquence, la taille des données utilisées pour cette division est très inférieure à l'ensemble des données validées.


== Licence ==
== Licence ==
Ligne 6 : Ligne 7 :
== Historique ==  
== Historique ==  


* '''27h''' validées en décembre 2024, CC-0.
* '''27h''' validées en décembre 2024
* '''29h''' validées en novembre 2025




[[Category:breton|Categories]]
[[Category:breton|Categories]]
[[Category:Corpus audio transcrit - breton|Categories]]
[[Category:Corpus audio transcrit - breton|Categories]]

Version du 28 octobre 2025 à 10:24

La distribution officielle inclut une division en train/dev/test après déduplication par phrase (si une même phrase a été enregistrée par deux personnes différentes, seul un de ces deux enregistrements apparaît), en conséquence, la taille des données utilisées pour cette division est très inférieure à l'ensemble des données validées.

Licence

La licence affichée est CC-0, mais le téléchargement est soumis à un accord de non-redistribution.

Historique

  • 27h validées en décembre 2024
  • 29h validées en novembre 2025