« Common Voice - Breton » : différence entre les versions
Aller à la navigation
Aller à la recherche
Aucun résumé des modifications |
|||
| Ligne 1 : | Ligne 1 : | ||
* Mozilla. 2023. ''Common Voice'', [https://commonvoice.mozilla.org/en/datasets datatsets en breton]. | * Mozilla. 2023. ''Common Voice'', [https://commonvoice.mozilla.org/en/datasets datatsets en breton]. | ||
La distribution officielle inclut une division en train/dev/test après déduplication par phrase (si une même phrase a été enregistrée par deux personnes différentes, seul un de ces deux enregistrements apparaît), en conséquence, la taille des données utilisées pour cette division est très inférieure à l'ensemble des données validées. | |||
== Licence == | == Licence == | ||
| Ligne 6 : | Ligne 7 : | ||
== Historique == | == Historique == | ||
* '''27h''' validées en décembre 2024 | * '''27h''' validées en décembre 2024 | ||
* '''29h''' validées en novembre 2025 | |||
[[Category:breton|Categories]] | [[Category:breton|Categories]] | ||
[[Category:Corpus audio transcrit - breton|Categories]] | [[Category:Corpus audio transcrit - breton|Categories]] | ||
Version du 28 octobre 2025 à 10:24
- Mozilla. 2023. Common Voice, datatsets en breton.
La distribution officielle inclut une division en train/dev/test après déduplication par phrase (si une même phrase a été enregistrée par deux personnes différentes, seul un de ces deux enregistrements apparaît), en conséquence, la taille des données utilisées pour cette division est très inférieure à l'ensemble des données validées.
Licence
La licence affichée est CC-0, mais le téléchargement est soumis à un accord de non-redistribution.
Historique
- 27h validées en décembre 2024
- 29h validées en novembre 2025