Questions fréquemment posées

De Entrelangues
Aller à la navigation Aller à la recherche

Cette page recense les questions fréquemment posées aux porteurs du projet Entrelangues. Elle synthétise au mieux les réponses que l'équipe essaie d'y apporter.


Questions sur le projet

À qui est destiné le projet Entrelangues ?

Le projet Entrelangues se veut un outil transversal à différentes communautés parlantes, et aux communautés de recherche universitaires. Il doit pouvoir servir à des juristes des langues, des personnels soignants et des enseignant·e·s, des linguistes descriptifs et formels, des sociologues des langues, des instances de décisions des politiques linguistiques, des chercheuses et chercheurs en traitement automatique des langues, et des développeurs d'applications numériques. Pour toutes et tous, cet ouvrage en ligne veut apporter une information accessible, succincte et claire, leur permettant de trouver réponse facilement aux questions qui leur sont propres.

Qui participe ?

Toute personne peut créer un compte à son nom réel, et contribuer, comme sur n'importe quel wiki ouvert. Les contributions ressemblent à celles de wikipedia en ce qu'un article résulte de multiples apports, et que sa complétude dépend de la diversité des apports, universitaires ou non tant que les sources d'information sont dûment référencées. Le site est tourné vers son utilisabilité par des scientifiques de champs d'expertise différents, et doit être accessible aux communautés parlantes des langues de l'État français. Il privilégie la clarté d'exposition. Il valorise particulièrement pour cette raison les ressources en langues de l'État français, dont le français.

Le projet est résolument scientifique. Les universitaires, linguistes et experts de langue sont particulièrement bienvenus. Le site wiki est ouvert et surveillé. Nous opérons une veille scientifique pour nous assurer que les contributions référencent au mieux l'état des recherches actuelles, et répondent aux standards des méthodologies scientifiques. La qualité des contributions est protégée.

Pourquoi participer ?

La dimension inventorielle permet d'appréhender sous différents angles la réalité de la diversité linguistique dans l'État français, de cartographier aussi les zones d'ombre peu travaillées. La tenue d'un inventaire des langues est une condition nécessaire pour reconnaître et prendre en compte la diversité linguistique, assurer l'inclusivité citoyenne et optimiser la communication et les services pour un public diversifié.

Renseigner le volet linguistique et sociolinguistique des langues permet de pallier en partie au manque de continuité et de robustesse du soutien universitaire à son exploration pérenne. Sur la plupart des centaines de langues de l'État français, une à deux personnes enquêtent sur toutes ces dimensions ensembles, et sont de plus chargées de leur enseignement. Dans ces disciplines rares, perdre la trace de recherches effectuées, de corpus réalisés, voire perdre l'accessibilité à ces ressources a des conséquences sur le champ entier, et même sur la visibilité institutionnelle de la langue et la représentation que les locuteurs ont de leurs propres langues. Les informations apportées sur le site Entrelangues doivent pouvoir être pertinentes sur le long terme, assurer des passations de recherches malgré souvent des trous générationnels, et préserver globalement la mémoire de recherche de disciplines rares.

Renseigner le volet TAL des langues participe à leur donner une chance de survivre à l'ère de l'intelligence artificielle. Entrelangues fournit un espace de mise en contact entre experts de langues et développeurs pour améliorer et référencement, la trouvabilité et les métadonnées des corpus des langues qui en ont peu. Pour accélérer la montée en ressources des langues minorisées, la stratégie est ici de faciliter les approches qualitatives, de compenser la rareté des corpus par leur renseignement soigneux. Effectuer ce travail en regard des recherches sociologiques, linguistiques et typologiques permet, sur ces langues à faibles ressources, de s'adosser à un inventaire déjà organisé, et de visualiser rapidement le potentiel de développement d'un projet donné sur de multiples dimensions (partenaires universitaire et de politique linguistique, situation légale, ressources immédiatement disponibles, collectabilité, défis orthographiques, numérisabilité de corpus papier, potentiel d'ouverture en droits d'ouvrages clef, communauté enseignante ou pas, etc.).

Il s'agit d'un ouvrage scientifique collectif. Les chercheurs en poste dans les instituts publics ou privés peuvent à tout moment, pour leurs évaluations internes, quantifier automatiquement leurs contributions sur le site. Il suffit d'aller sur sa page de contributeur, et de cliquer sur "Contributions de l'utilisateur". Une liste automatique des contributions est géénrée.

Pourquoi pas directement renseigner les grandes plateformes anglophones de TAL ?

Déployer une recherche de pointe en langue anglaise est indispensable en traitement automatique des langues pour répondre aux standards internationaux et se connecter à la recherche internationale (hors Chine et Inde). Les plateformes généralistes anglophones Glottolog, OLAC, Ethnologue ou WALS doivent donc être renseignées au plus près, et chacun peut constater les manques actuels sur ces plateformes (pour un aperçu des manques, voir les ressources de l'OLAC pour les langues en France). Le niveau de détail sur chaque langue y est insatisfaisant, et en manque d'informations généralistes transdisciplinaires. Pourquoi alors ne pas directement renseigner ces plates-formes ?

Quand on considère les langues de l'État français, il est crucial de ne pas oublier que les locuteurs ne sont communément pas bilingues avec l'anglais, mais avec le français. Un jour viendra sans doute où les traducteurs multilingues, au moins français-anglais, rendront caduque cet écueil, mais ce jour n'est pas encore venu. Les locuteurs comme les experts de langues et autres relais pour le développement numérique doivent pouvoir avoir accès à des ressources accessibles et qui leur soit ouvertes à commentaires. Ces experts sur leurs langues doivent pouvoir contribuer au montage des ressources sur leur propre langue et la renseigner eux-mêmes, constituer leurs corpus, compléter ou corriger les ressources universitaires, notifier des manques ou forces d'une ressource donnée, suggérer des potentiels de leur position située privilégiée.

Chacun des axes d'approche scientifique de ces langues nécessite la prise en compte du bilinguisme avec le français. C'est nécessaire sous l'angle légal pour l'accès aux droits citoyens, sous l'angle linguistique pour l'étude des changements furtifs d'une langue à l'autre, sous l'angle cognitif selon la distance typologique des structures grammaticales rendues compatibles au sein d'une même phrase, sous l'angle sociolinguistique pour ce que ce bilinguisme réalise dans l'ancrage social, enfin sous l'angle du traitement automatique des langues: une synthèse de la voix ne pourra pas reproduire les pratiques réelles de passage d'une langue à l'autre si des données bilingues sur la même voix ne sont pas sélectionnées en amont.

Ces langues s'inscrivent de plus dans un cadre légal et sociolinguistique spécifiquement français, et est contraint par les paramètres spécifiques des écosystèmes construits par la politique linguistique française, passée et présente. Sous cet angle, les préoccupations sociolinguistiques d'un locuteur de l'anglais de Gustavia (langue germanique à Saint-Barthélemy aux Antilles) est plus facilement compréhensible à une chercheuse sur le francique (langue germanique des Vosges, métropole) qu'à un chercheur sur l'anglais américain (langue germanique, hors État français). Cette connaissance est cruciale pour collecter des données, chercher des financements et des partenaires de projets, entrer en contact avec les structures de politique linguistique, ou peser les tabous sociaux sur certaines approches. Explorer le cadre légal français pour ces langues fait appel de plus à une communauté universitaire, celle des juristes, pour qui l'enquête se déploie aussi principalement en français.

La grande part des référencements automatiques des grandes plateformes est nourrie de métadonnées claires sur les corpus, outils et applications en ligne. Pour enrichir ces plateformes, il faut donc répandre les bonnes pratiques conseillées pour les métadonnées. Ce site y contribue en participant à l'éducation des communautés constituant les corpus.

Questions pratiques sur l'inventaire des langues

Pourquoi dire "langue de l'État français" ?

... Pourquoi pas "de la république française" ou "de France" ?

Le terme d'État français dénote l'espace politique de l'État en France, l'espace où s'exercent les fonctions régaliennes d'État et l'espace dans lequel ses impôts sont collectés auprès de ses citoyennes et citoyens. C'est un terme neutre en ce qu'il ne fait référence ni à un système politique particulier de gouvernance comme le nom "république", ni à l'idée de Nation comme le nom "France". Ces deux notions sont par ailleurs compatibles avec l'État français, et pour des courants de pensée ces notions peuvent même être synonymes, mais ces notions ne sont pas scientifiquement pertinentes pour l'analyse des langues, et leur mobilisation dans une approche scientifique n'est pas ici justifiée.

Historiquement, le régime de Vichy a utilisé ce terme d'État français, expression qui évitait de mettre en mots la teneur de son régime politique. Cette histoire a laissé la trace dans les pratiques linguistiques actuelles d'un évitement de cette expression. Cependant, l'évitement actuel des mots de l'évitement Vichyste ne devrait pas nous priver de mots précis. Ni le signifiant de l'État français ni son signifié n'appartiennent au régime de Vichy. Le terme d'État français est par ailleurs parallèle aux expressions utilisées ailleurs en Europe, et le gouvernement français, lorsqu'il s'exprime en anglais, utilise French State.

Comment décide-t-on qu'une langue est une "langue de l'État français" ?

Il faut qu'elle y soit parlée par des personnes qui ne s'y considèrent pas touristes.

Si en plus ce n'est pas la langue officielle d'un autre pays, alors cette langue est considérée comme une langue de l'État français. Dans d'autres cas, il s'agit d'une langue qui est aussi langue officielle d'un autre pays. Il faut alors comprendre si les variantes parlées dans l'État français dépendent de dialectalisations externes à l'État français, ou si une variété a émergé en bilinguisme avec une variété de français ou avec une autre langue de l'État français. S'il y a une évidence scientifique de spécificité linguistique pour une variété de langue parlée dans l'État français, alors cette variété est une langue de l'État français. Évidemment, cela ne signifie en aucun cas que l'État français réclame comme sienne la langue officielle d'un autre pays.

Doit-on aussi mettre les dialectes ?

Il n'existe pas scientifiquement de différence entre un dialecte et une langue. La différence sémantique entre le mot dialecte et le mot langue est que le mot dialecte est un mot relationnel: il implique un lien proche avec une autre variété linguistique.

Les dialectes étant des langues, il faut les documenter dans la mesure où y a une nécessité de documenter une variété linguistique, et il est important de rassembler ici les outils de son étude. Identifier une langue comme un dialecte d'une autre est important dans la mesure où cela met typologiquement les langues en relation.

Doit-on mettre les langues officielles ailleurs ?

La question de l'inclusion des langues d'immigration ou des langues transfrontalières comme "langues de l'État français" se pose lorsqu'elles sont la langue officielle d'un autre pays.