« Common Voice - Breton » : différence entre les versions

De Entrelangues
Aller à la navigation Aller à la recherche
Aucun résumé des modifications
Ligne 1 : Ligne 1 :
* Mozilla. 2023. ''Common Voice'', [https://commonvoice.mozilla.org/en/datasets datatsets en breton].
* Mozilla. 2023. ''Common Voice'', [https://commonvoice.mozilla.org/en/datasets datatsets en breton].
La distribution officielle inclut une division en train/dev/test après déduplication par phrase (si une même phrase a été enregistrée par deux personnes différentes, seul un de ces deux enregistrements apparaît), en conséquence, la taille des données utilisées pour cette division est très inférieure à l'ensemble des données validées.
 
 
: La distribution officielle inclut une division en train/dev/test après déduplication par phrase (si une même phrase a été enregistrée par deux personnes différentes, seul un de ces deux enregistrements apparaît), en conséquence, la taille des données utilisées pour cette division est très inférieure à l'ensemble des données validées.
 


== Licence ==
== Licence ==
La licence affichée est CC-0, mais le téléchargement est soumis à un accord de non-redistribution.
La licence affichée est CC-0, mais le téléchargement est soumis à un accord de non-redistribution.


== Historique ==  
== Historique ==  

Version du 28 octobre 2025 à 15:53


La distribution officielle inclut une division en train/dev/test après déduplication par phrase (si une même phrase a été enregistrée par deux personnes différentes, seul un de ces deux enregistrements apparaît), en conséquence, la taille des données utilisées pour cette division est très inférieure à l'ensemble des données validées.


Licence

La licence affichée est CC-0, mais le téléchargement est soumis à un accord de non-redistribution.


Historique

  • 27h validées en décembre 2024
  • 29h validées en novembre 2025