« Common Voice - Breton » : différence entre les versions
Aller à la navigation
Aller à la recherche
Aucun résumé des modifications |
|||
| Ligne 1 : | Ligne 1 : | ||
* Mozilla. 2023. ''Common Voice'', [https://commonvoice.mozilla.org/en/datasets datatsets en breton]. | * Mozilla. 2023. ''Common Voice'', [https://commonvoice.mozilla.org/en/datasets datatsets en breton]. | ||
La distribution officielle inclut une division en train/dev/test après déduplication par phrase (si une même phrase a été enregistrée par deux personnes différentes, seul un de ces deux enregistrements apparaît), en conséquence, la taille des données utilisées pour cette division est très inférieure à l'ensemble des données validées. | |||
: La distribution officielle inclut une division en train/dev/test après déduplication par phrase (si une même phrase a été enregistrée par deux personnes différentes, seul un de ces deux enregistrements apparaît), en conséquence, la taille des données utilisées pour cette division est très inférieure à l'ensemble des données validées. | |||
== Licence == | == Licence == | ||
La licence affichée est CC-0, mais le téléchargement est soumis à un accord de non-redistribution. | La licence affichée est CC-0, mais le téléchargement est soumis à un accord de non-redistribution. | ||
== Historique == | == Historique == | ||
Version du 28 octobre 2025 à 15:53
- Mozilla. 2023. Common Voice, datatsets en breton.
- La distribution officielle inclut une division en train/dev/test après déduplication par phrase (si une même phrase a été enregistrée par deux personnes différentes, seul un de ces deux enregistrements apparaît), en conséquence, la taille des données utilisées pour cette division est très inférieure à l'ensemble des données validées.
Licence
La licence affichée est CC-0, mais le téléchargement est soumis à un accord de non-redistribution.
Historique
- 27h validées en décembre 2024
- 29h validées en novembre 2025