« États généraux du multilinguisme dans les outre-mer/Thématiques/Les technologies de la langue, la présence des langues sur la toile et sur les réseaux sociaux » : différence entre les versions

Un livre de Wikilivres.
Contenu supprimé Contenu ajouté
Ligne 94 : Ligne 94 :


Cette thématique de l’atelier portait sur « les technologies de la langue pour l’aide aux usagers des services publics ». L’atelier a commencé par faire une description de ce que sont les technologies de la langue et également de l’importance de pouvoir disposer de données afin de pouvoir développer ces technologies. Je crois qu’il y a eu un accord unanime au sein de l’atelier, pour dire que les technologies de la langue sont nécessaires et, pour certains, sont même indispensables si on veut permettre le multilinguisme.
Cette thématique de l’atelier portait sur « les technologies de la langue pour l’aide aux usagers des services publics ». L’atelier a commencé par faire une description de ce que sont les technologies de la langue et également de l’importance de pouvoir disposer de données afin de pouvoir développer ces technologies. Je crois qu’il y a eu un accord unanime au sein de l’atelier, pour dire que les technologies de la langue sont nécessaires et, pour certains, sont même indispensables si on veut permettre le multilinguisme.

On note actuellement une explosion des applications de ces technologies et, en particulier, sur l’internet, mais également sur les terminaux mobiles. Mais on constate également et donc, là, c’est souligné très justement par [http://llacan.vjf.cnrs.fr/pers/p_diki.htm Marcel Diki Kidiri], ces technologies n’existent que pour 1% des langues qui sont parlées dans le monde. Donc elles existent pour une soixantaine de langues sur les quelques 6000 qui sont parlées dans le monde. Et je pense que c’est une constatation qui est tout à fait essentielle.
On note actuellement une explosion des applications de ces technologies et, en particulier, sur l’internet, mais également sur les terminaux mobiles. Mais on constate également et donc, là, c’est souligné très justement par [http://llacan.vjf.cnrs.fr/pers/p_diki.htm Marcel Diki Kidiri], ces technologies n’existent que pour 1% des langues qui sont parlées dans le monde. Donc elles existent pour une soixantaine de langues sur les quelques 6000 qui sont parlées dans le monde. Et je pense que c’est une constatation qui est tout à fait essentielle.

Les propositions que l’on fait sont de se donner pour objectif de développer les technologies de la langue pour toutes les langues de France et en particulier pour les langues d’outre-mer, et donc pas uniquement pour le français, et ce dans le cadre d’une recherche coordonnée, d’adapter les technologies qui existent pour ces langues, de produire les données, les corpus, les lexiques qui sont nécessaires au développement de ces technologies et d’évaluer systématiquement les performances qui sont obtenues pour les comparer aux besoins les applications que l’on vise.
Les propositions que l’on fait sont de se donner pour objectif de développer les technologies de la langue pour toutes les langues de France et en particulier pour les langues d’outre-mer, et donc pas uniquement pour le français, et ce dans le cadre d’une recherche coordonnée, d’adapter les technologies qui existent pour ces langues, de produire les données, les corpus, les lexiques qui sont nécessaires au développement de ces technologies et d’évaluer systématiquement les performances qui sont obtenues pour les comparer aux besoins les applications que l’on vise.

Alors quelles technologies ? On ne va pas brasser l’ensemble des technologies pour commencer, donc en choisir quelques unes.
Alors quelles technologies ? On ne va pas brasser l’ensemble des technologies pour commencer, donc en choisir quelques unes.
On a pensé qu’il fallait peut-être privilégier les technologies qui ont trait à l’oral. Donc la reconnaissance de la parole, la synthèse vocale, cela parce qu’il y a un intérêt pour les langues à tradition orale sans système d’écriture, parce qu’il y a un intérêt également pour les cas d’[[w:Illettrisme|illettrisme]] ou d’[[w:Analphabétisme|analphabétisme]], parce qu’on peut profiter de cette manière-là du formidable déploiement de la téléphonie mobile que j’évoquais et enfin, parce qu’en permettant le passage de l’écrit à l’oral et réciproquement, c’est également une aide qu’on peut apporter au [[w:Handicap|handicap]] dans l’accessibilité à l’information et ce, donc, pour les [[w:Malvoyant|malvoyants]] et les [[w:Hypoacousie|malentendants]]. Donc une notion d’accessibilité.
On a pensé qu’il fallait peut-être privilégier les technologies qui ont trait à l’oral. Donc la reconnaissance de la parole, la synthèse vocale, cela parce qu’il y a un intérêt pour les langues à tradition orale sans système d’écriture, parce qu’il y a un intérêt également pour les cas d’[[w:Illettrisme|illettrisme]] ou d’[[w:Analphabétisme|analphabétisme]], parce qu’on peut profiter de cette manière-là du formidable déploiement de la téléphonie mobile que j’évoquais et enfin, parce qu’en permettant le passage de l’écrit à l’oral et réciproquement, c’est également une aide qu’on peut apporter au [[w:Handicap|handicap]] dans l’accessibilité à l’information et ce, donc, pour les [[w:Malvoyant|malvoyants]] et les [[w:Hypoacousie|malentendants]]. Donc une contribution à cette notion d’accessibilité.

Les autres technologies auxquelles on peut penser en priorité sont la traduction automatique et la traduction vocale. Cela permettrait peut-être de résoudre le problème de la traduction simultanée en 50 langues, soit 2500 paires de langues, pour ces Etats-Généraux qu’évoquait tout à l’heure Xavier North.
Les autres technologies auxquelles on peut penser en priorité sont la traduction automatique et la traduction vocale. Cela permettrait peut-être de résoudre le problème de la traduction simultanée en 50 langues, soit 2500 paires de langues, pour ces Etats-Généraux qu’évoquait tout à l’heure Xavier North.

Dans le cadre de ces développements de technologies, peut-être faut-il privilégier tout ce qui est [[w:Logiciel libre|logiciel libre]] et donnée libre.
Dans le cadre de ces développements de technologies, peut-être faut-il privilégier tout ce qui est [[w:Logiciel libre|logiciel libre]] et donnée libre.

Quelles langues ? On ne va pas attaquer de front les dizaines de langues auxquelles on pourrait penser, mais peut-être choisir quelques langues, 4 à 5 pour commencer, travailler peut-être par famille de langues en les identifiant, avec peut-être un intérêt particulier, ça a été souligné, pour les langues véhiculaires, et, en ce qui concerne la traduction, peut-être commencer par la traduction de et vers le français puisque nous avons le français en partage.
Quelles langues ? On ne va pas attaquer de front les dizaines de langues auxquelles on pourrait penser, mais peut-être choisir quelques langues, 4 à 5 pour commencer, travailler peut-être par famille de langues en les identifiant, avec peut-être un intérêt particulier, ça a été souligné, pour les langues véhiculaires, et, en ce qui concerne la traduction, peut-être commencer par la traduction de et vers le français puisque nous avons le français en partage.

Quelles applications pour les besoins des usagers des services publics ? On entrevoit quelques pistes qui sont encore à approfondir, peut-être en lançant une enquête auprès des usagers.
Quelles applications pour les besoins des usagers des services publics ? On entrevoit quelques pistes qui sont encore à approfondir, peut-être en lançant une enquête auprès des usagers.

A été mentionnée la traduction pour les usagers de la poste, des banques, dans les hôpitaux, puisque qu’on voit qu’il existe actuellement une barrière des langues qui constitue un obstacle à la qualité du service rendu au public. Cela a été mentionné pour plusieurs de ces services. Traduction pour les soins médicaux et là, on peut penser que la machine pourrait assurer une confidentialité que ne permet pas à l’heure actuelle l'intervention de médiateurs humains. Cela a aussi été souligné au tout début de cet après-midi.
Également traduction pour pouvoir publier dans sa langue maternelle et accéder aux ouvrages et aux documents que l’on peut trouver sur les bibliothèques numériques.
A été mentionnée la traduction pour les usagers de la poste, des banques, dans les hôpitaux, puisque qu’on voit qu’il existe actuellement une barrière des langues qui constitue un obstacle à la qualité du service rendu au public. Cela a été mentionné pour plusieurs de ces services. Traduction pour les soins médicaux et là, on peut penser que la machine pourrait assurer une confidentialité que ne permet pas à l’heure actuelle l'intervention de médiateurs humains. Cela a aussi été souligné au tout début de cet après-midi. Également traduction pour pouvoir publier dans sa langue maternelle et accéder aux ouvrages et aux documents que l’on peut trouver sur les bibliothèques numériques.

Quelques autres exemples d’applications auxquelles on peut penser : des bornes vocales plurilingues dans les musées ou dans les administrations, l’aide en ligne pour l’apprentissage des langues. Et également tout ce qui concerne le sous-titrage automatique et peut-être même la traduction à la demande des émissions radio ou télédiffusées.
Quelques autres exemples d’applications auxquelles on peut penser : des bornes vocales plurilingues dans les musées ou dans les administrations, l’aide en ligne pour l’apprentissage des langues. Et également tout ce qui concerne le sous-titrage automatique et peut-être même la traduction à la demande des émissions radio ou télédiffusées.



Version du 25 juillet 2012 à 20:54

Présentation générale

Internet et les technologies du numérique offrent de nouvelles opportunités pour la vitalité des langues, leur valorisation, leur transmission et leur enseignement. Les technologies de la langue, si elles sont développées pour les langues régionales, sont de nature à répondre aux besoins d’aide à la traduction et à l’interprétation pour les usagers des services publics. Dans cette perspective, il était nécessaire de faire un point sur la nature et l’avancée des technologies de la langue, de mener une réflexion sur la façon dont elles pourraient être utilisées pour faciliter le multilinguisme et d’évaluer la nature et la taille de l’effort à effectuer pour doter les langues d’outre-mer de telles technologies. Le développement de la diversité culturelle et linguistique sur internet nécessite également une meilleure connaissance de la présence des langues sur internet, ainsi qu’un accompagnement pour la constitution de réseaux sociaux et de communautés de locuteurs.

Table-ronde

Propos introductif : Adrienne Alix (Wikimédia France)

Fichier:Adrienne Alix.png
Adrienne Alix

Je vais vous parler ici avec un regard très naïf et qui découvre, je ne suis ni spécialiste des langues, ni des outre-mer, par contre, un peu plus du numérique et je vais essayer d’introduire cette deuxième table ronde en montrant un peu les opportunités et l’intérêt du numérique et d’internet pour la valorisation, la préservation, la diffusion des langues d’outre-mer tout en vous faisant part de mon étonnement, ce matin, de ne pas avoir vu ou entendu parler à aucun moment d’internet ou de quoi que ce soit qui puisse faire penser au numérique. Cela me démangeait d’en parler et je me suis dit que j’allais attendre cet après-midi pour pouvoir en parler tous ensemble.

Pour schématiser très rapidement, ce qui est pour moi le fondement d’internet, c’est tout d’abord un réseau décentralisé, quelque chose qui, dans sa conception, est totalement indépendant techniquement de toute structure étatique ou autre, cela n’a pas été construit pour ça, c’est quelque chose qui a été fait pour le partage, pour la circulation de l’information, c’est un réseau qui permet l’initiative individuelle et l’initiative collective sans demander à qui que ce soit avant de le faire. C’est donc, à mon sens, un des outils les plus pratiques, un outil idéal pour la diffusion, la préservation et le travail sur les langues.

J’ai entendu, ce matin, beaucoup de réflexions sur les problèmes avec l’institution Éducation nationale par exemple, ou ce qu’on en attend, ce qu’on lui reproche. S’il y a un espace de liberté beaucoup plus grand où l’on a pas à demander ou avoir besoin d’une loi, c’est bien internet. Si vous voulez voir comment on peut faire démarrer une langue rare, une langue peu parlée, peu dotée, comme le dit monsieur Diki Kidiri, je vous invite à lire le rapport qu’il a fait il y a déjà cinq ans, sur comment assurer la présence d’une langue sur le cyberespace et qui, pour moi, était quelque chose d’assez fondamental pour comprendre comment une langue qu’il appelle « peu dotée », avec peu de ressources écrites et peu de ressources numériques, peut avoir sa place sur internet.

Je vais vous parler de quelque chose que je connais plus particulièrement et qui me semble être un excellent vecteur des langues, c’est Wikipédia. Je vais d’abord faire un petit point sur les problématiques que j’ai pu relever sur les langues. Quelle est la place que peuvent prendre les langues d’outre-mer, les langues de France sur Internet ? Il y a un certain nombre de problématiques pas forcément insurmontables mais qui se posent actuellement.

  • La première, c’est la mesure de la place des langues. Mesurer combien il y a de pages web en français, en allemand, en anglais, en créole, dans n’importe quelle langue est quelque chose de difficile. Les moteurs de recherche n’indexent pas toutes les pages. C’est à dire que, sans savoir ce qui existe, c’est difficile de pouvoir promouvoir une langue, donc c’est un des problèmes pour trouver la place des langues sur le numérique. Google, le moteur de recherche le plus pratiqué au monde, ne propose son interface qu’en cent cinquante langues, ce qui n’est pas énorme, et fait un travail sérieux de résultats de moteur de recherche qu’en environ trente cinq langues, donc on est très loin de pouvoir faire émerger la diversité.
  • Deuxième problématique importante, celle de la fixation écrite de la langue, qui n’est pas spécifique au numérique mais qui se pose forcément sur internet puisque internet est principalement un internet écrit.
  • Troisième point, vouloir faire exister une langue sur internet nécessite une traduction des interfaces des logiciels qui permettent de produire du contenu pour qu’il y ait une réelle appropriation par les locuteurs.
  • Et puis, dernier problème, beaucoup plus pratique, celui de la connexion à internet qui n’est pas forcément très évidente suivant là où l’on se trouve.

Donc, les bases d’un multilinguisme sur internet assumé, où on puisse s’exprimer sans aucun problème, ne sont pas forcément simples, mais on a quand même la possibilité, pour chaque langue, de trouver sa place, si elle est portée par une communauté de locuteurs active, motivée et qui intègre les enjeux du numérique pour la diffusion d’une langue en dehors d’une communauté.

J’en arrive maintenant au sujet que je connais le mieux et qui me semble être un bon exemple de multilinguisme, qui est l’encyclopédie Wikipédia que vous connaissez probablement en français, en anglais, peut-être moins dans d’autres langues, et qui a la particularité d’être collaborative, ouverte à tous, il n’y a pas de barrière à l’écriture pour tous ceux qui veulent contribuer, qui est diffusée sous une licence libre qui permet donc une réelle diffusion, redistribution, réappropriation, remixage, sous n’importe quel support et qui est, dans son essence même, multilingue, c’est-à-dire qu’on n’est pas dans un concept de traduction d’une langue à l’autre, mais de développement totalement autonome de chaque langue, à partir du moment où elle a une communauté de locuteurs qui a pris en charge la création d’une version linguistique de l’encyclopédie. Pour vous donner une idée, en dix ans, on est passé du Wikipédia en anglais né en 2001 à 283 éditions linguistiques totalement autonomes, dont une quarantaine ont plus de cent mille articles, et qui comportent des langues extrêmement parlées mais aussi des langues extrêmement peu parlées suivant la communauté qui va la porter. En français on est à un million deux cent mille articles.

Autour de Wikipédia gravitent d’autres sites qui sont d’autres moyens de couvrir les champs du savoir, les champs de la culture et de la contribution. Parmi ceux-ci, j’en distingue trois, une médiathèque qui s’appelle Wikimédia commons qui héberge tous les fichiers multimédias, vidéos, photos, qui n’est pas multilingue mais unilingue avec des interfaces, par contre, dans différentes langues, et qui compte plus de onze millions de fichiers, Wikisource qui existe dans une cinquantaine de langues et qui est une bibliothèque de textes sous licences libres ou dans le domaine public et puis, le Wiktionnaire dont je vous parlerai plus longuement tout à l’heure qui est un dictionnaire multilingue qui existe dans plusieurs dizaines de langues et qui, en français, compte plus de deux millions d’entrées. Quelle est la place des langues d’outre-mer sur Wikipédia ? C’est une présence extrêmement faible. On a que deux langues qui ont une version linguistique autonome de Wikipédia réellement active, le tahitien et le créole haïtien, avec assez peu d’articles quant on compare avec d’autres langues. Trois versions linguistiques sont en cours de création, à un tout premier stade, le créole guadeloupéen qui ne compte que quatre articles encyclopédiques, ce qui, rapporté au nombre de locuteurs potentiels, est très faible, le hmong et le wallisien. Alors est-ce que la solution serait d’adopter une démarche de traduction systématique qui n’est pas la démarche originelle de Wikipédia, et de faire travailler les gens systématiquement en français et dans leur langue, pour créer des contenus dans les langues d’outre-mer sur tous types de sujets encyclopédiques et aussi créer des contenus en français sur les thématiques de l’outre-mer ? Pour vous donner une image de ce qui peut se faire dans l’autre sens, sur Wikipédia en français, en revanche, l’outre-mer est très présent. On a à peu près 6000 articles qui concernent très précisément les outre-mer, cela va de 60 articles pour Wallis et Futuna à 2400 pour la Réunion, c’est donc très disparate mais très comparable au traitement des autres régions françaises, rapportée au nombre d’habitants la couverture des sujets sur l’outre-mer est plutôt bien faite alors qu’à l’inverse, la couverture de n’importe quel sujet n’est absolument pas faite dans les langues locales. Peut-être que le préalable à l’écriture encyclopédique et le partage du savoir encyclopédique dans les langues locales doit se faire d’abord par la mise à disposition de plus de vocabulaire écrit, d’un dictionnaire plus accessible à tous. Un des projets Wikimédia, le Wiktionnaire, est intéressant dans son approche multilingue. Il va exister dans plusieurs dizaines de langues et, en français, va donner des définitions de mots de différentes langues. Pour vous donner un exemple, le Wiktionnaire francophone compte un peu plus de deux millions de définitions et propose des définitions de ces mots dans 987 langues différentes. 14 langues d’outre-mer sont représentées, plus que dans Wikipédia et dans ces principales langues on retrouve le tahitien, le créole haïtien et celui de Guadeloupe. A noter que certaines langues comme le malgache ont un Wiktionnaire extrêmement fourni, bien plus que d’autres langues bien plus dotées. Donc ce Wiktionnaire est une aide au travail d’écriture des langues, de traduction, de transcription d’une langue à une autre et je me pose la question de savoir si ça ne serait pas un préalable à la création de contenu encyclopédique, c’est-à-dire d’abord décrire les mots et, une fois ces mots décrits, une fois les concepts posés, pouvoir ensuite entamer ce travail encyclopédique qui pour l’instant n’existe pas vraiment.

Pour terminer, quelques questions avant les ateliers, sur la place des langues sur le numérique, quelle est la place écrite de ces langues ? Je pense que c’est l’un des points fondamentaux, comment écrire, comment avoir une graphie commune ? Est-on obligé d’avoir cette stabilisation écrite pour aller sur internet ou y a-t-il un moyen de faire autrement ? Comment donner de la visibilité à une langue ? Et est-ce que, pour vous, la valorisation de la langue par le numérique est quelque chose de naturel qu’il convient de développer ou pas ? Qui est à même de prendre en charge ces actions, est-ce à l’État ou aux individus ? Les pratiques sur internet sont des pratiques individuelles ou par communauté plutôt que des pratiques étatiques, êtes-vous prêts ou motivés pour prendre en charge des actions de valorisation sur le numérique ? Enfin, est ce que cette démarche de co-construction par la traduction systématique français et langue locale pour faire progresser les contenus dans les deux langues et faire progresser la connaissance et la langue dans les deux langues est ce une bonne solution ? En tous cas, sachez que l’association Wikimédia France pour laquelle je travaille et qui s’occupe de valoriser et diffuser Wikipédia sur le territoire français et non pas forcément que en langue française, est tout à fait disposée à vous aider si vous avez une envie de valoriser vos langues sur Wikipédia et on aura tout à l’heure, dans un atelier, l’occasion d’entrer plus en détail dans cela. Voilà, pour ma part, la réflexion que je me faisais sur le numérique.


Merci Adrienne. Rozenn Milin de l’Association Sorosoro, je vous donne la parole.

Expert 1 : Rozenn Milin (SOROSORO)

Fichier:Rozenn Milin.png
Rozenn Milin

Je vais essayer d’être brève pour vous parler de Sorosoro. C’est un programme qui travaille à la sauvegarde des langues en danger sur des supports audiovisuels et numériques, pas seulement sur l’outre-mer, c’est un programme généraliste qui s’occupe de toutes les langues du monde, mais qui a aussi travaillé sur l’outre-mer, la Guyane et la Nouvelle-Calédonie en particulier, grâce à la DGLFLF du ministère de la Culture et de la Communication qui nous accueille ici et encore merci de cette invitation.

Le sujet est donc ici, la présence des langues sur la toile et les réseaux sociaux. J’ai pensé qu’il fallait remettre tout cela en contexte même si cela a été fort bien fait par Adrienne et que Marcel le fera également, je vais juste reprendre les critères qui sont donnés par les experts de l’UNESCO pour évaluer les critères de vitalité des langues. Il y a bien sûr le nombre de locuteurs, il y a aussi la transmission de génération en génération, on a beaucoup évoqué la Bretagne je suis bretonne, je parle breton et j’en sais quelque chose de ce problème de transmission quand la majorité des locuteurs a plus de soixante ans et qu’elle ne transmet plus sa langue, c’est que la langue est très mal en point, la présence de l’éducation est, bien sûr, un sujet majeur, mais il y a aussi la présence dans la vie publique qui est un des critères retenus par l’UNESCO pour déterminer la vitalité des langues. Qui dit vie publique, dit beaucoup présence dans les médias, alors si on reprend chronologiquement, il y avait la presse écrite, il y a eu la radio, la télé et aujourd’hui internet qui bouleverse un peu tout. Si je reprends quelques chiffres de 2008 d’une étude de TNS Sofres qui dit que la consommation moyenne par français de télévision par jour était, en 2008, de trois heures et sept minutes. Dans le même temps, la consommation internet de loisirs était de deux heures dix sept minutes par jour. Aujourd’hui on est passé à trois heures trente pour la télévision et je n’ai pas le chiffre pour internet, mais on est très certainement proche du même temps en consommation internet qu’on l’est en consommation télévisuelle. C’est dire si le monde des médias est en train d’être bouleversé et il est clair que, pour des langues minoritaires, pour qu’elles aient une chance de survivre à l’avenir dans ce monde qui est très technologique et globalisé, il faudra être présent sur internet. Je peux vous donner un autre chiffre qui n’est pas récent mais je ne pense pas qu’il ait changé beaucoup, quatre vingt dix pourcent des pages disponibles sur internet sont en seulement douze langues. Il est difficile d’avoir des données récentes car tout passe par des moteurs de recherche et Google est un peu avare d’informations, mais s’intéresse de près aux langues en danger puisqu’ils ont l’intention de lancer une plateforme autour de ces langues en début d’année prochaine. C’est donc un sujet qui devient assez chaud.

Alors comment renforcer la présence de langues minoritaires sur le net, et comment fait-on ? Déjà beaucoup de langues qui sont parlées minoritairement, de petites langues en nombre de locuteurs, sont parlées dans des endroits où il n’y a pas d’ordinateurs, pas d’accès internet et parfois même pas d’électricité. Ce n’est pas forcément le cas pour les langues d’outre-mer, mais d’autres questions se posent de façon cruciale, comment fait-on pour poster des contenus sur internet quand la langue n’est pas codifiée ? Si elle est codifiée, combien de personnes savent l’écrire ? Et quand on sait l’écrire, qui va contribuer, parce qu’il faut du temps pour contribuer sur internet ? Ces populations ont généralement un nombre de locuteurs relativement bas, les langues ne sont pas forcément codifiées, pas forcément écrites et il faut encore que les locuteurs se saisissent de leur langue et produisent des contenus pour internet. Cela fait beaucoup de « il faudrait que » et, très souvent, ces communautés ont d’autres priorités que de poster des contenus sur internet. Ce sont des questions qui se posent, on a pas forcément les réponses mais en tous cas, ce qu’on fait nous à Sorosoro, c’est qu’on exploite une autre voie qui est celle de l’audiovisuel, qui suit un schéma de tradition orale puisque notre objet est d’envoyer sur le terrain, un peu partout dans le monde, des équipes filmer ce qu’on espère être la substantifique moelle de ces langues et des cultures qu’elles véhiculent bien entendu. Donc nous partons sur le terrain, avec des linguistes et des anthropologues parfois, et nous ramenons des dizaines d’heures de rushes qui sont tout ce que l’on peut collecter de tradition orale : des contes, des récits, des rites, de la pharmacopée, des connaissances diverses et variées, des savoir-faire, la vie quotidienne etc… Puis tout cela est dérushé, archivé, indexé, déposé à l’INA et toute une partie de cela est montée et mis en ligne sur internet sur notre site internet qui s’appelle http://www.sorosoro.org/ que certains d’entre vous connaissent ici probablement.

Alors nous avons déjà, notamment grâce à la DGLFLF, commencé à travailler sur les outre-mer et espérons pouvoir poursuivre, nous avons filmé en Nouvelle-Calédonie, merci Claire Moïse qui était la linguiste qui accompagnait notre équipe de tournage, merci aussi à l’Académie des Langues Kanak qui a effectué les traductions en xârâcùù puisque nous avons filmé trois langues kanak, le xârâcùù, le xârâgurè et le xâmea, vous pouvez d’ailleurs voir dans le hall d’entrée des vidéos qui passent sur Sorosoro, sur la construction des cases, mais aussi sur les bébé lecture dont parlait Marie Adèle Jorédié, et on la voit avec ses enfants. Le travail que nous faisons sert à la recherche mais peut également servir à l’enseignement ou l’accompagnement à l’enseignement des langues, puisqu’on filme à chaque fois des tas de petits mots de la vie quotidienne, on fait donner les chiffres de un à dix, les couleurs, les jours de la semaine, les parties du corps, toutes ces choses qui peuvent être utilisées dans un cadre d’enseignement, de transmission de la langue et puis toute cette tradition orale que l’on filme et qu’on met en ligne progressivement peut également servir pour transmettre tous ces savoirs et cette tradition orale à tous ceux qui sont désireux de les apprendre. Internet sert également à cela. Nous avons également filmé cet été, avec Maurice Tiouka, dans sa propre communauté Kali'na en Guyane, qui sera en ligne après un long processus de traduction. Voilà, nous espérons pouvoir continuer ce travail, je vous invite à aller voir sur le site pour mieux comprendre ce que nous faisons, qui n’est pas une solution universelle mais qui contribue à cette présence des langues de l’outre-mer et, au-delà, de toutes les langues en danger dans le monde sur internet.


Merci. Marcel Diki Kidiri vous faites partie du Réseau Maaya qui essaye de mesurer la présence des langues sur internet.

Expert 2 : Marcel Diki Kidiri (Groupe MAAYA)

Fichier:Marcel Diki Kidiri.png
Marcel Diki Kidiri

En 2005 à l’occasion du sommet mondial pour la société de l’information qui s’est tenu à Tunis a été créé à l’initiative de l’Académie Africaine des Langues, le réseau Maaya qui est un réseau mondial pour la diversité linguistique. Maaya est un mot mandingue qui se traduit en français par humanitude et en langue bantoue par un mot qui renvoie à la divinité de l'homme. Depuis sa création, ce réseau a organisé un forum international à Bamako en 2007 sur la diversité linguistique dans le monde et quatre symposium internationaux, deux en [[[w:Russie|Russie]], un à Barcelone et un à Brasilia sur la diversité linguistique dans le cyberespace. La question de la diversité linguistique dans le cyberespace est très présente dans les activités de Maaya qui est entrain de mettre en chantier un très ambitieux programme de création ou de production d’un nouveau moteur de recherche pour une meilleure mesure de la diversité linguistique dans le cyberespace.

Dans la mesure où Google n’est plus du tout capable de le faire et les moteurs de recherche actuels ne donnent pas l’image de la réalité de l’internet. Ceci est confirmé par nos collègues de Maaya mais également l’université de Nagaoka au Japon qui observe aussi la diversité des langues dans le cyberespace. Je remercie la DGLFLF de m’avoir invité ici au nom de réseau Maaya pour vous parler un peu de ce que nous faisons.

Je veux vous parler de mon intérêt pour les langues dans le cyberespace. Cela m’est venu du fait, qu’au départ, j’étais uniquement linguiste africaniste décrivant la langue Sango de la République Centrafricaine qui est aujourd’hui une des deux langues officielles du pays, le Sango et le Français et, avant de devenir langue officielle, le Sango était considérée comme une non-langue et le chemin a été très long pour qu’elle devienne, aujourd’hui, langue officielle. En 1991 j’ai créé un premier site sur le Sango en me disant, personne ne le lira, je le fais pour moi. Trois mois après je reçois des mails du Canada, du Japon, de France, de gens qui étaient émus de voir le Sango sur internet. J’étais très surpris de voir que des gens pouvaient s’intéresser à cette langue. Cela m’a beaucoup encouragé à dire comment on peut faire pour mettre sur internet une langue inconnue pour qu’elle devienne connue. Bien sûr l’internet de 1991 n’est pas celui d’aujourd’hui où tout site digne de ce nom est interactif et social. En 1991 n’importe qui pouvait créer une page internet et mettre sa langue dessus. C’est comme si on mettait un poster sur des murs. Cela fait de ma langue une langue morte sur internet. Pour qu’elle devienne langue vivante, il faut qu’il y ait derrière une communauté. Des gens qui s’écrivent, se répondent, qui réagissent. Donc il faut la formation d’une ressource humaine, d’une communauté qui communique et travaille dans cette langue. Avant même de mettre cette langue sur internet il faut qu’elle soit écrite. Si elle n’est pas écrite, il faut passer par des techniques de reconnaissance vocale qui ne sont pas à la portée de tout le monde, c’est réalisable mais il faut des spécialistes pour le faire. Une fois que la langue est écrite, vous savez tout le débat que l’on a à se mettre d’accord sur une orthographe, il faut pouvoir collecter des textes, créer des forums de discussions.

J’ai été amené à écrire cet ouvrage qui est diffusé en portugais, en russe, en français, en anglais et en espagnol « Comment assurer la présence d'une langue dans le cyberespace ? ». Moi je suis parti d’une langue très petite, parlée par deux ou trois personnes, dans la mesure où ces deux ou trois personnes sont décidées à la faire connaître, il faut développer les ressources linguistiques — décrire la langue, écrire la grammaire, écrire les dictionnaires — et aussi traduire le vocabulaire technique pour qu’elle puisse être vivante sur internet, comment on dit naviguer, cliquer,… ce sont des métaphores qu’on doit culturellement intégrer.

Il faut également développer les ressources culturelles. Les gens qui parlent cette langue ont une culture. Comment faire pour transmettre cette culture pour faire partager cela ? Hier j’étais très heureux de voir l’excellence du spectacle fourni par ces enfants. Je me suis dit, y a t-il un moyen de le mettre sur internet pour que ce soit partagé jusqu’au fin fond de l’univers ? Ce que les enfants ont dit est universel. Comment constituer les ressources culturelles locales sous un format partageable sur internet ? Il y a donc la langue, les ressources linguistiques, les ressources culturelles et ensuite les ressources humaines, former les gens pour qu’ils puissent travailler avec internet et enfin, développer les technologies pour l’accès.


Merci Marcel Diki Kidiri . Le représentant de l’institution auquel nous avons demandé d’apporter son point de vue à cette table ronde est chargé de la publication au Centre National de Documentation Pédagogique et s’intéresse particulièrement au support virtuel.

Représentant de l'institution : Bruno Dairou (Centre national de documentation pédagogique)

Fichier:Bruno Dairou.png
Bruno Dairou

Le représentant de l’institution est là, très modestement, pour vous dire que justement, tout ce qu’on a développé autour de l’enseignement des langues est finalement très proprement enrichi par les langues régionales. Et, évidemment, pour différentes raisons, sans doute le poids de l’enseignement de la langue française dans le socle commun, des motifs politiques, des motifs linguistiques bien sûr avec une insuffisante description des langues, donc on vient plutôt dans l’idée de voir comment on peut travailler ensemble, beaucoup plus qu’on ne l’a fait jusque là.

Pour autant, ce n’est pas négliger la place des langues sur internet et dans les nouvelles technologies. En tous cas, le CNDP s’est saisi à bras le corps de tout cela et pour plusieurs raisons. D’abord, bien évidemment, parce que la demande était forte. Il y avait à la fois une nouvelle façon d’enseigner les langues vivantes et il y avait, de manière complémentaire, le problème du français langue étrangère, langue seconde, langue de scolarisation. Cet ensemble a fait qu’il a fallu développer des outils. Ces outils qui nous posent des tas de problèmes et je pense qu’il faut se parler franchement, de validation des contenus, il est certain que c’est de la qualité pédagogique qu’il nous faut sur ces outils, donc des circuits de validation. Le CNDP fournit les ressources pour les enseignants donc il faut que ces contenus soient validés, fiables et qu’on arrive à les reproduire et les utiliser.

On a développé des outils, je pense - en vous laissant de côté tout ce qui sera les tableaux blancs interactifs - au fait de remplir les espaces numériques de travail qui a occupé beaucoup de forces vives au CNDP, en matière de langues vivantes, et cela a décentré la position de l’enseignant dans la classe. Donc ce n’était plus un dispositif frontal, c’était une utilisation active de ces méthodes grâce aux nouvelles technologies. Ce qui a permis de nouveaux rebonds, d’utiliser et de créer de nouveaux outils, tablettes numériques que nous fournissons très pauvrement en contenus, nous n’en sommes qu’au début et, ce matin dans les ateliers, cela a été évoqué très richement et il faudrait que l’on puisse évoquer des partenariats, mais il y a aussi ce que l’on appelle et que nous tirons de chez nos amis canadiens, la baladodiffusion, donc le fait qu’on utilise désormais ce qui est de l’univers des élèves, donc la possibilité de descendre de l’information sur leurs baladeurs, que ce soit en audio ou vidéo, que ce soient eux-même qui génèrent le flux. Donc le CNDP fournit des ressources dans ces domaines. Mais ce qui est intéressant et qu’on doit essayer de bâtir ensemble, et cela ressortait des ateliers de ce matin, c’est d’aboutir à des ressources et là aussi, je crois qu’il y a des partenariats à bâtir.

Cela ne veut pas dire qu’il n’y a rien d’existant, les CRDP ont beaucoup travaillé sur des ouvrages imprimés, mais aussi pour fournir des contenus numériques. L’intérêt pour nous, serait de travailler ensemble et je vous dis ce que le CNDP développe, nous développons les télévisions permettant d’aborder l’étude des langues, on essaye de le généraliser mais je crois qu’il y aurait un travail en commun à faire, des projets voient le jour, de plateformes de vidéo qui restent à nourrir, et il y aurait la possibilité d’introduire les langues régionales de manière pertinente, les langues en ligne, nous avons des séquences nombreuses, mais sur les langues régionales cela reste encore à développer et à bâtir. C’est le cas aussi de sites gratuits très consultés, plus d’un million de clics par an, sur lesquels la place des langues régionales reste à faire. C’est vous dire que le CNDP est partie prenante de cela et on continue d’accompagner les langues des outre-mer mais c’est à l’état embryonnaire et je crois que cela peut être un effet de ces états généraux, se dire qu’il est grand temps qu’on travaille plus grandement ensemble.


Restitution des ateliers

Les possibilités offertes par les technologies de la langue pour améliorer la relation aux usagers dans les services publics

Cette thématique de l’atelier portait sur « les technologies de la langue pour l’aide aux usagers des services publics ». L’atelier a commencé par faire une description de ce que sont les technologies de la langue et également de l’importance de pouvoir disposer de données afin de pouvoir développer ces technologies. Je crois qu’il y a eu un accord unanime au sein de l’atelier, pour dire que les technologies de la langue sont nécessaires et, pour certains, sont même indispensables si on veut permettre le multilinguisme.

On note actuellement une explosion des applications de ces technologies et, en particulier, sur l’internet, mais également sur les terminaux mobiles. Mais on constate également et donc, là, c’est souligné très justement par Marcel Diki Kidiri, ces technologies n’existent que pour 1% des langues qui sont parlées dans le monde. Donc elles existent pour une soixantaine de langues sur les quelques 6000 qui sont parlées dans le monde. Et je pense que c’est une constatation qui est tout à fait essentielle.

Les propositions que l’on fait sont de se donner pour objectif de développer les technologies de la langue pour toutes les langues de France et en particulier pour les langues d’outre-mer, et donc pas uniquement pour le français, et ce dans le cadre d’une recherche coordonnée, d’adapter les technologies qui existent pour ces langues, de produire les données, les corpus, les lexiques qui sont nécessaires au développement de ces technologies et d’évaluer systématiquement les performances qui sont obtenues pour les comparer aux besoins les applications que l’on vise.

Alors quelles technologies ? On ne va pas brasser l’ensemble des technologies pour commencer, donc en choisir quelques unes. On a pensé qu’il fallait peut-être privilégier les technologies qui ont trait à l’oral. Donc la reconnaissance de la parole, la synthèse vocale, cela parce qu’il y a un intérêt pour les langues à tradition orale sans système d’écriture, parce qu’il y a un intérêt également pour les cas d’illettrisme ou d’analphabétisme, parce qu’on peut profiter de cette manière-là du formidable déploiement de la téléphonie mobile que j’évoquais et enfin, parce qu’en permettant le passage de l’écrit à l’oral et réciproquement, c’est également une aide qu’on peut apporter au handicap dans l’accessibilité à l’information et ce, donc, pour les malvoyants et les malentendants. Donc une contribution à cette notion d’accessibilité.

Les autres technologies auxquelles on peut penser en priorité sont la traduction automatique et la traduction vocale. Cela permettrait peut-être de résoudre le problème de la traduction simultanée en 50 langues, soit 2500 paires de langues, pour ces Etats-Généraux qu’évoquait tout à l’heure Xavier North.

Dans le cadre de ces développements de technologies, peut-être faut-il privilégier tout ce qui est logiciel libre et donnée libre.

Quelles langues ? On ne va pas attaquer de front les dizaines de langues auxquelles on pourrait penser, mais peut-être choisir quelques langues, 4 à 5 pour commencer, travailler peut-être par famille de langues en les identifiant, avec peut-être un intérêt particulier, ça a été souligné, pour les langues véhiculaires, et, en ce qui concerne la traduction, peut-être commencer par la traduction de et vers le français puisque nous avons le français en partage.

Quelles applications pour les besoins des usagers des services publics ? On entrevoit quelques pistes qui sont encore à approfondir, peut-être en lançant une enquête auprès des usagers.

A été mentionnée la traduction pour les usagers de la poste, des banques, dans les hôpitaux, puisque qu’on voit qu’il existe actuellement une barrière des langues qui constitue un obstacle à la qualité du service rendu au public. Cela a été mentionné pour plusieurs de ces services. Traduction pour les soins médicaux et là, on peut penser que la machine pourrait assurer une confidentialité que ne permet pas à l’heure actuelle l'intervention de médiateurs humains. Cela a aussi été souligné au tout début de cet après-midi. Également traduction pour pouvoir publier dans sa langue maternelle et accéder aux ouvrages et aux documents que l’on peut trouver sur les bibliothèques numériques.

Quelques autres exemples d’applications auxquelles on peut penser : des bornes vocales plurilingues dans les musées ou dans les administrations, l’aide en ligne pour l’apprentissage des langues. Et également tout ce qui concerne le sous-titrage automatique et peut-être même la traduction à la demande des émissions radio ou télédiffusées.

En résumé, le principe fondateur est de permettre à chacun, quelle que soit la langue qu'il parle, d’accéder à l’information, à la connaissance, quelle que soit la langue dans laquelle elle a été codée.

Présence et dialogue des langues et des cultures sur internet

Je ne vais pas résumer l'atelier parce que Thibault Grouas a fait un document très fidèle aux échanges qu’on a eus. Donc je présenterai l’ambiance générale, les idées qui se sont dégagées seulement. Échanges riches, beaucoup de participants, beaucoup de propositions, de discussions, de débats, de partages d’expérience, des pratiques, une atmosphère créative et productive donc l’ensemble des préconisations, selon moi, se sont situées d’un point de vue matériel, d’un point de vue contenu. D’un point de vue matériel, il s’agit de la création de points d’accès à internet dans tous les villages et sites isolés. Parce qu’on a des paraboles, mais il faut qu’elles fonctionnent encore parce que les dispenser à internet donc pourquoi pas les écoles et les villages. Équipement aussi des sites isolés et éloignés, des communes pratiquant les langues autochtones et s’assurer des aspects techniques de la gestion de ces centres. Et de leur bon fonctionnement. Au niveau contenu, il y a aussi deux volets, parce qu’il y a toujours le formel donc l’école et il y a aussi l’informel. Dans le formel, il s’agissait des sites en langues outre-mer avec une exigence de contenu des qualités. Si on écrit en créole sur le site créole, il ne faut pas faire de fautes d’orthographe, il ne faut pas raconter n’importe quoi si le professeur voit ça. Versus, l’espace libre d’échanges sans exigence de forme et d’orthographe où les enfants peuvent s’exprimer librement, dire ce qu’ils veulent sans se soucier de l’orthographe, ce qui les empêcherait de s’exprimer librement. Dans le cadre du formel, on a aussi eu une proposition très intéressante : l’introduction des nouvelles technologies dès la maternelle avec une vraie formation, parce qu’on sait aujourd’hui que, parfois, on forme les parents à travers les enfants. À cet âge-là, les parents se soucient beaucoup de ce que l’enfant a appris à l’école donc ce partage peut être aussi très bénéfique pour les parents. Partage des faits culturels, savoirs, savoir-faire au niveau communauté. Enregistrement sons, fiches techniques, je n’entrerai pas dans les détails, mettre des faits culturels, donc, avec l’accord des communautés, sur internet, faire partager la culture. Il y a eu beaucoup d’autres idées. Comment faire vivre le site une fois qu’on l’a créé ? Traduction ou pas ? Et il y a une autre idée très intéressante qui s’est dégagée ici, l’utilisation d’un site dans sa langue maternelle peut parfois favoriser une intimité culturelle (on a retenu ce terme), on a parfois envie de dire une chose sans la traduire et si on a envie de la traduire, on la traduit soi-même. Donc cette idée de traduction où on sait que les machines ne le font pas bien aujourd’hui, où ce n’est pas satisfaisant, on peut faire le choix de le faire soi-même ou, quand on a besoin de savoir ce qui se dit, on peut le demander et on trouvera de l’autre côté des interlocuteurs qui vont le faire.

Atelier d’écriture Wikipédia

Pour l’atelier « Wikipédia » qui était donc très centré sur un sujet et en petit comité, on a d’abord fait le constat que wikipédia était très peu investi par les langues d’outre-mer contrairement au contenu concernant l’outre-mer dans la langue française. Donc il y a un très fort déséquilibre entre le français et les langues d’outre-mer. La discussion avec les différentes personnes a montré ensuite que c’est pourtant un outil qui peut être assez fondamental dans la légitimation des langues, dans leur diffusion, dans leur transmission, pourquoi pas aussi un outil de stabilisation écrite des langues par le dialogue et le consensus entre les différents contributeurs. Et contribuer sur wikipedia en français à propos de l’outre-mer et contribuer dans les langues de l’outre-mer sur tous les sujets encyclopédiques, scientifiques, culturels, littéraires, etc. pouvait être un outil vraiment intéressant pour lutter contre cette idée de complexe de dévalorisation qui est quand même très présent et favoriser le sentiment de légitimité des langues locales sur internet. Ce que je retiens aussi, c’est que les personnes présentes se sont trouvées extrêmement motivées pour créer des versions linguistiques de wikipédia dans leur langue, donc c’est un très bon espoir et j’espère que ce sera concrétisé. Et une préconisation que l’on pourrait faire, c’est de proposer que l’association Wikimédia France qui a pour objectif de favoriser l’émergence de wikipédia travaille avec les différentes communautés et avec les différentes institutions, et notamment la DGLFLF, au soutien et à la coordination de créations de versions linguistiques de wikipédia dans les différentes langues locales, avec le bémol de la question à régler des langues qui ne sont pas encore écrites et donc là, on se retrouve avec l’éternel problème de l’oral et de l’écrit.

Recommandations

  • Renforcer de manière significative les infrastructures permettant l’accès à l’internet sur les territoires de l’outre-mer, notamment dans les zones les plus isolées, les établissements publics, les écoles.
  • Mettre en place un véritable programme pour faire entrer l’internet dans les écoles dès la maternelle, et développer l’usage des technologies pour l’apprentissage des langues maternelles, l’éducation à la maîtrise de l’écrit, la lutte contre l’absentéisme et l’illettrisme.
  • Mettre en place un programme d’introduction des outils d’aide à la traduction et à l’interprétation, et de bornes vocales plurilingues dans les services publics, pour améliorer les services aux usagers.
  • Encourager l’usage de l’internet par les citoyens dans leur langue maternelle, notamment au moyen des réseaux sociaux, de la messagerie instantanée, des tchats, ou des sites de partage de vidéos, avec pour objectif de briser le complexe qui empêche les citoyens de s’exprimer dans leur langue maternelle.
  • Mettre en place une action stratégique appuyée ou coordonnée par le ministère de la Culture et de la Communication en faveur du développement des pratiques d’écriture en langues de France sur Wikipédia notamment à l’école, et encourager l’émergence de communautés de contributeurs sur les territoires d’outre-mer.
  • Développer les technologies de traduction automatique du texte et de la parole, pour toutes les langues de France, et en particulier pour les langues d’outre-mer, dans le cadre d’une action de recherche coordonnée impliquant une évaluation systématique les performances obtenues par ces technologies au fur et à mesure de leur développement, et une mesure régulière des besoins des usagers.
  • Disposer de systèmes de traduction et de référencement en langues régionales, pour accéder aux ouvrages, ou plus généralement aux documents dans les bibliothèques numériques.
  • Développer les applications et interfaces orales avec restitution orale (reconnaissance vocale, aide à la traduction) pour les langues minoritaires et non écrites, et à destination des publics fragilisés (illettrisme, analphabétisme, handicaps visuel et auditif).
  • Développer les corpus en langues régionales, en quantité et de qualité suffisantes pour développer les technologies de la langue. On pourra s’appuyer notamment sur les ressources de Wikipédia et du Wiktionnaire en langues de France.
  • Encourager le développement ou l’utilisation de logiciels libres, de plates-formes collaboratives et de données libres de droits pour le développement des technologies de la langue.
  • Mettre à disposition du public des outils pour le sous-titrage automatique et la traduction à la demande des émissions radio ou télédiffusées.
  • Répertorier la présence sur internet des langues parlées en outre-mer.