« États généraux du multilinguisme dans les outre-mer/Thématiques/Les technologies de la langue, la présence des langues sur la toile et sur les réseaux sociaux » : différence entre les versions

Un livre de Wikilivres.
Contenu supprimé Contenu ajouté
modif
Ligne 5 : Ligne 5 :
Le développement de la diversité culturelle et linguistique sur internet nécessite également une meilleure connaissance de la présence des langues sur internet, ainsi qu’un accompagnement pour la constitution de réseaux sociaux et de communautés de locuteurs.
Le développement de la diversité culturelle et linguistique sur internet nécessite également une meilleure connaissance de la présence des langues sur internet, ainsi qu’un accompagnement pour la constitution de réseaux sociaux et de communautés de locuteurs.


==Propos introductif : [http://www.wikimedia.fr/salari%C3%A9s Adrienne Alix] ([[w:Wikimedia|Wikimédia]] France)==
==Atelier : Technologies de la langue pour l’aide aux usagers des services publics==
[[File:Adrienne Alix.png|thumb|Adrienne Alix]]
*Modérateur : [http://perso.limsi.fr/Individu/mariani/ Joseph Mariani] ([http://www.immi-labs.org Institut des technologies Multilingues et Multimédias de l'Information (IMMI/CNRS)])
*Rapporteure : Anne Pajard ([http://www.manioc.org/ MANIOC] bibliothèque numérique [[w:Guyane|Guyane]])


Je vais vous parler ici avec un regard très naïf et qui découvre, je ne suis ni spécialiste des langues, ni des outre-mer, par contre, un peu plus du numérique et je vais essayer d’introduire cette deuxième table ronde en montrant un peu les opportunités et l’intérêt du numérique et d’internet pour la valorisation, la préservation, la diffusion des langues d’outre-mer tout en vous faisant part de mon étonnement, ce matin, de ne pas avoir vu ou entendu parler à aucun moment d’internet ou de quoi que ce soit qui puisse faire penser au numérique. Cela me démangeait d’en parler et je me suis dit que j’allais attendre cet après-midi pour pouvoir en parler tous ensemble.
===Résumé===
L’atelier a débuté par une présentation rappelant ce que recouvrent les technologies de la Langue, et soulignant l’importance de disposer de données pour pouvoir les développer.


Pour schématiser très rapidement, ce qui est pour moi le fondement d’internet, c’est tout d’abord un réseau décentralisé, quelque chose qui, dans sa conception, est totalement indépendant techniquement de toute structure étatique ou autre, cela n’a pas été construit pour ça, c’est quelque chose qui a été fait pour le partage, pour la circulation de l’information, c’est un réseau qui permet l’initiative individuelle et l’initiative collective sans demander à qui que ce soit avant de le faire. C’est donc, à mon sens, un des outils les plus pratiques, un outil idéal pour la diffusion, la préservation et le travail sur les langues.
Il y a eu un accord unanime de l’ensemble des participants à l'atelier pour affirmer que les technologies de la Langue sont nécessaires, et même indispensables pour permettre le multilinguisme.


J’ai entendu, ce matin, beaucoup de réflexions sur les problèmes avec l’institution Éducation nationale par exemple, ou ce qu’on en attend, ce qu’on lui reproche. S’il y a un espace de liberté beaucoup plus grand où l’on a pas à demander ou avoir besoin d’une loi, c’est bien internet.
On note une explosion des applications de ces technologies, en particulier sur l’internet et sur les terminaux mobiles, mais on constate que ces technologies n’existent que pour 1% des langues parlées dans le monde (une soixantaine sur les quelques 6000 langues répertoriées), comme le souligne très justement [http://llacan.vjf.cnrs.fr/pers/p_diki.htm Marcel Diki-Kidiri].
Si vous voulez voir comment on peut faire démarrer une langue rare, une langue peu parlée, peu dotée, comme le dit monsieur [http://llacan.vjf.cnrs.fr/pers/p_diki.htm Diki Kidiri], je vous invite à lire le rapport qu’il a fait il y a déjà cinq ans, sur comment assurer la présence d’une langue sur le [[w:Cyberespace|cyberespace]] et qui, pour moi, était quelque chose d’assez fondamental pour comprendre comment une langue qu’il appelle « peu dotée », avec peu de ressources écrites et peu de ressources numériques, peut avoir sa place sur internet.


Je vais vous parler de quelque chose que je connais plus particulièrement et qui me semble être un excellent vecteur des langues, c’est [[w:Wikipédia|Wikipédia]]. Je vais d’abord faire un petit point sur les problématiques que j’ai pu relever sur les langues. Quelle est la place que peuvent prendre les langues d’outre-mer, les langues de France sur Internet ? Il y a un certain nombre de problématiques pas forcément insurmontables mais qui se posent actuellement.
===Préconisations===


*La première, c’est la mesure de la place des langues. Mesurer combien il y a de pages web en français, en allemand, en anglais, en créole, dans n’importe quelle langue est quelque chose de difficile. Les moteurs de recherche n’indexent pas toutes les pages. C’est à dire que, sans savoir ce qui existe, c’est difficile de pouvoir promouvoir une langue, donc c’est un des problèmes pour trouver la place des langues sur le numérique. Google, le moteur de recherche le plus pratiqué au monde, ne propose son interface qu’en cent cinquante langues, ce qui n’est pas énorme, et fait un travail sérieux de résultats de moteur de recherche qu’en environ trente cinq langues, donc on est très loin de pouvoir faire émerger la diversité.
La proposition exprimée dans l’atelier est de se donner pour objectif de développer les technologies de la langue pour toutes les langues de France, et en particulier pour les langues d’outre-mer, et pas uniquement pour le français comme cela est le cas actuellement, dans le cadre d’une action de recherche coordonnée.
*Deuxième problématique importante, celle de la fixation écrite de la langue, qui n’est pas spécifique au numérique mais qui se pose forcément sur internet puisque internet est principalement un internet écrit.
*Troisième point, vouloir faire exister une langue sur internet nécessite une traduction des interfaces des logiciels qui permettent de produire du contenu pour qu’il y ait une réelle appropriation par les locuteurs.
*Et puis, dernier problème, beaucoup plus pratique, celui de la connexion à internet qui n’est pas forcément très évidente suivant là où l’on se trouve.


Donc, les bases d’un multilinguisme sur internet assumé, où on puisse s’exprimer sans aucun problème, ne sont pas forcément simples, mais on a quand même la possibilité, pour chaque langue, de trouver sa place, si elle est portée par une communauté de locuteurs active, motivée et qui intègre les enjeux du numérique pour la diffusion d’une langue en dehors d’une communauté.
Cela pourrait se faire en adaptant pour ces langues les technologies qui existent déjà pour d’autres langues, dont le français. Pour ce faire, il faut produire les données (corpus, lexiques,…), en quantité et qualité suffisantes pour permettre le développement de ces technologies. Il conviendra également d’évaluer systématiquement les performances obtenues par ces technologies au fur et à mesure de leur développement et de les comparer aux besoins des applications que l’on vise.


J’en arrive maintenant au sujet que je connais le mieux et qui me semble être un bon exemple de multilinguisme, qui est l’encyclopédie Wikipédia que vous connaissez probablement en français, en anglais, peut-être moins dans d’autres langues, et qui a la particularité d’être collaborative, ouverte à tous, il n’y a pas de barrière à l’écriture pour tous ceux qui veulent contribuer, qui est diffusée sous une [[w:Licence libre|licence libre]] qui permet donc une réelle diffusion, redistribution, réappropriation, remixage, sous n’importe quel support et qui est, dans son essence même, multilingue, c’est-à-dire qu’on n’est pas dans un concept de traduction d’une langue à l’autre, mais de développement totalement autonome de chaque langue, à partir du moment où elle a une communauté de locuteurs qui a pris en charge la création d’une version linguistique de l’encyclopédie.
- Quelles technologies choisir ?
Pour vous donner une idée, en dix ans, on est passé du Wikipédia en anglais né en 2001 à 283 éditions linguistiques totalement autonomes, dont une quarantaine ont plus de cent mille articles, et qui comportent des langues extrêmement parlées mais aussi des langues extrêmement peu parlées suivant la communauté qui va la porter. En français on est à un million deux cent mille articles.


Autour de Wikipédia gravitent d’autres sites qui sont d’autres moyens de couvrir les champs du savoir, les champs de la culture et de la contribution. Parmi ceux-ci, j’en distingue trois, une médiathèque qui s’appelle [[w:Wikimedia Commons|Wikimédia commons]] qui héberge tous les fichiers multimédias, vidéos, photos, qui n’est pas multilingue mais unilingue avec des interfaces, par contre, dans différentes langues, et qui compte plus de onze millions de fichiers, [[w:Wikisource|Wikisource]] qui existe dans une cinquantaine de langues et qui est une bibliothèque de textes sous licences libres ou dans le domaine public et puis, le [[w:Wiktionnaire|Wiktionnaire]] dont je vous parlerai plus longuement tout à l’heure qui est un dictionnaire multilingue qui existe dans plusieurs dizaines de langues et qui, en français, compte plus de deux millions d’entrées.
Il est proposé de choisir quelques technologies pour commencer.
Quelle est la place des langues d’outre-mer sur Wikipédia ? C’est une présence extrêmement faible. On a que deux langues qui ont une version linguistique autonome de Wikipédia réellement active, le [[w:Tahitien|tahitien]] et le [[w:Haïtien|créole haïtien]], avec assez peu d’articles quant on compare avec d’autres langues. Trois versions linguistiques sont en cours de création, à un tout premier stade, le [[w:Créole guadeloupéen|créole guadeloupéen]] qui ne compte que quatre articles encyclopédiques, ce qui, rapporté au nombre de locuteurs potentiels, est très faible, le [[w:Langues hmong|hmong]] et le [[w:Wallisien|wallisien]].
Alors est-ce que la solution serait d’adopter une démarche de traduction systématique qui n’est pas la démarche originelle de Wikipédia, et de faire travailler les gens systématiquement en français et dans leur langue, pour créer des contenus dans les langues d’outre-mer sur tous types de sujets encyclopédiques et aussi créer des contenus en français sur les thématiques de l’outre-mer ?
Pour vous donner une image de ce qui peut se faire dans l’autre sens, sur Wikipédia en français, en revanche, l’outre-mer est très présent. On a à peu près 6000 articles qui concernent très précisément les outre-mer, cela va de 60 articles pour Wallis et Futuna à 2400 pour la Réunion, c’est donc très disparate mais très comparable au traitement des autres régions françaises, rapportée au nombre d’habitants la couverture des sujets sur l’outre-mer est plutôt bien faite alors qu’à l’inverse, la couverture de n’importe quel sujet n’est absolument pas faite dans les langues locales. Peut-être que le préalable à l’écriture encyclopédique et le partage du savoir encyclopédique dans les langues locales doit se faire d’abord par la mise à disposition de plus de vocabulaire écrit, d’un dictionnaire plus accessible à tous.
Un des projets Wikimédia, le Wiktionnaire, est intéressant dans son approche multilingue. Il va exister dans plusieurs dizaines de langues et, en français, va donner des définitions de mots de différentes langues. Pour vous donner un exemple, le Wiktionnaire francophone compte un peu plus de deux millions de définitions et propose des définitions de ces mots dans 987 langues différentes. 14 langues d’outre-mer sont représentées, plus que dans Wikipédia et dans ces principales langues on retrouve le tahitien, le créole haïtien et celui de Guadeloupe. A noter que certaines langues comme le malgache ont un Wiktionnaire extrêmement fourni, bien plus que d’autres langues bien plus dotées. Donc ce Wiktionnaire est une aide au travail d’écriture des langues, de traduction, de transcription d’une langue à une autre et je me pose la question de savoir si ça ne serait pas un préalable à la création de contenu encyclopédique, c’est-à-dire d’abord décrire les mots et, une fois ces mots décrits, une fois les concepts posés, pouvoir ensuite entamer ce travail encyclopédique qui pour l’instant n’existe pas vraiment.


Pour terminer, quelques questions avant les ateliers, sur la place des langues sur le numérique, quelle est la place écrite de ces langues ? Je pense que c’est l’un des points fondamentaux, comment écrire, comment avoir une graphie commune ? Est-on obligé d’avoir cette stabilisation écrite pour aller sur internet ou y a-t-il un moyen de faire autrement ? Comment donner de la visibilité à une langue ? Et est-ce que, pour vous, la valorisation de la langue par le numérique est quelque chose de naturel qu’il convient de développer ou pas ? Qui est à même de prendre en charge ces actions, est-ce à l’État ou aux individus ? Les pratiques sur internet sont des pratiques individuelles ou par communauté plutôt que des pratiques étatiques, êtes-vous prêts ou motivés pour prendre en charge des actions de valorisation sur le numérique ? Enfin, est ce que cette démarche de co-construction par la traduction systématique français et langue locale pour faire progresser les contenus dans les deux langues et faire progresser la connaissance et la langue dans les deux langues est ce une bonne solution ?
On pourra privilégier les technologies ayant trait à l’oral (reconnaissance de la parole, synthèse vocale, par exemple), car :
En tous cas, sachez que l’association Wikimédia France pour laquelle je travaille et qui s’occupe de valoriser et diffuser Wikipédia sur le territoire français et non pas forcément que en langue française, est tout à fait disposée à vous aider si vous avez une envie de valoriser vos langues sur Wikipédia et on aura tout à l’heure, dans un atelier, l’occasion d’entrer plus en détail dans cela. Voilà, pour ma part, la réflexion que je me faisais sur le numérique.
Elles présentent un intérêt pour traiter les langues à tradition orale, sans système d’écriture ;
Elles sont essentielles dans les cas d’[[w:Illettrisme|illettrisme]] ou d’[[w:Analphabétisme|analphabétisme]] ;
Cela permet de profiter du formidable déploiement de la téléphonie mobile ;
Elles permettent le passage de l’écrit à l’oral, et réciproquement, pour l’aide au handicap dans l’accessibilité à l’information pour les [[w:Malvoyant|malvoyants]] ou les [[w:Hypoacousie|malentendants]] ;
Ainsi que les technologies de traduction automatique, voire de traduction vocale qui pourraient permettre de résoudre également le problème de traduction simultanée entre de nombreuses paires de langues pour assurer l’intermédiation lors de colloques internationaux semblables à ces états généraux eux-mêmes.
Pour le développement de ces technologies, on encouragera le développement ou l’utilisation de [[w:Logiciel libre|logiciels libres]] (comme Moses en traduction automatique), de [[w:Plate-forme collaborative|plates-formes collaboratives]] (comme Let’sMT!) et de données libres de droits (comme celles de [[w:Wikipédia|Wikipedia]]).


- Quelles langues choisir ?


:''Merci Adrienne. Rozenn Milin de l’Association Sorosoro, je vous donne la parole.''
Il est également proposé de choisir quelques langues (4 à 5) dans un premier temps. On pourra alléger l’effort en travaillant sur des familles de langues (les [[w:Créoles à base lexicale française|créoles à base lexicale française]] par exemple). On a exprimé l’intérêt de traiter les langues véhiculaires. En ce qui concerne la traduction automatique, on pourrait commencer sur des paires de langues incluant le français comme langue source ou langue cible, puisque nous avons le français en partage. Il faudra par ailleurs vérifier que toutes les langues concernées sont bien répertoriées sur internet.


==Expert 1 : [[w:Rozenn Milin|Rozenn Milin]] ([[w:Sorosoro|SOROSORO]])==
- Quelles applications choisir ?
[[File:Rozenn Milin.png|thumb|Rozenn Milin]]
Je vais essayer d’être brève pour vous parler de Sorosoro. C’est un programme qui travaille à la sauvegarde des [http://www.unesco.org/new/fr/culture/themes/endangered-languages/ langues en danger] sur des supports audiovisuels et numériques, pas seulement sur l’outre-mer, c’est un programme généraliste qui s’occupe de toutes les langues du monde, mais qui a aussi travaillé sur l’outre-mer, la Guyane et la Nouvelle-Calédonie en particulier, grâce à la [[w:Délégation générale à la langue française et aux langues de France|DGLFLF]] du ministère de la Culture et de la Communication qui nous accueille ici et encore merci de cette invitation.


Le sujet est donc ici, la présence des langues sur la toile et les [[w:Réseau social|réseaux sociaux]]. J’ai pensé qu’il fallait remettre tout cela en contexte même si cela a été fort bien fait par Adrienne et que Marcel le fera également, je vais juste reprendre les critères qui sont donnés par les experts de l’[[w:Organisation des Nations unies pour l'éducation, la science et la culture|UNESCO]] pour évaluer les critères de vitalité des langues.
Plusieurs pistes d’applications pour les besoins des usagers des services publics ont été proposées :
Il y a bien sûr le nombre de locuteurs, il y a aussi la transmission de génération en génération, on a beaucoup évoqué la [[w:Bretagne|Bretagne]] je suis bretonne, je parle [[w:Breton|breton]] et j’en sais quelque chose de ce problème de transmission quand la majorité des locuteurs a plus de soixante ans et qu’elle ne transmet plus sa langue, c’est que la langue est très mal en point, la présence de l’éducation est, bien sûr, un sujet majeur, mais il y a aussi la présence dans la vie publique qui est un des critères retenus par l’UNESCO pour déterminer la vitalité des langues. Qui dit vie publique, dit beaucoup présence dans les médias, alors si on reprend chronologiquement, il y avait la presse écrite, il y a eu la radio, la télé et aujourd’hui internet qui bouleverse un peu tout. Si je reprends quelques chiffres de 2008 d’une étude de [[w:TNS Sofres|TNS Sofres]] qui dit que la consommation moyenne par français de télévision par jour était, en 2008, de trois heures et sept minutes. Dans le même temps, la consommation internet de loisirs était de deux heures dix sept minutes par jour. Aujourd’hui on est passé à trois heures trente pour la télévision et je n’ai pas le chiffre pour internet, mais on est très certainement proche du même temps en consommation internet qu’on l’est en consommation télévisuelle. C’est dire si le monde des médias est en train d’être bouleversé et il est clair que, pour des langues minoritaires, pour qu’elles aient une chance de survivre à l’avenir dans ce monde qui est très technologique et globalisé, il faudra être présent sur internet.
Développer des systèmes d’aide à la traduction pour les usagers de la poste et des banques, ou dans les hôpitaux, où l’on voit qu’il existe actuellement une barrière des langues qui constitue un obstacle à la qualité du service rendu au public ;
Je peux vous donner un autre chiffre qui n’est pas récent mais je ne pense pas qu’il ait changé beaucoup, quatre vingt dix pourcent des pages disponibles sur internet sont en seulement douze langues. Il est difficile d’avoir des données récentes car tout passe par des moteurs de recherche et Google est un peu avare d’informations, mais s’intéresse de près aux langues en danger puisqu’ils ont l’intention de lancer une plateforme autour de ces langues en début d’année prochaine. C’est donc un sujet qui devient assez chaud.
Envisager des systèmes de traduction pour les soins médicaux, la machine pouvant assurer une confidentialité que ne permet pas l’intervention actuelle de médiateurs humains ;
Disposer de systèmes de traduction pour pouvoir publier dans sa langue maternelle, chacun pouvant lire dans sa propre langue, et pour accéder aux ouvrages, ou plus généralement aux documents dans les bibliothèques numériques ;
Installer des bornes vocales plurilingues dans les musées, ou dans les administrations ;
Fournir des logiciels d’aide en ligne pour l’apprentissage des langues ;
Permettre le sous-titrage automatique et la traduction à la demande des émissions radio ou télédiffusées, le principe fondateur étant de permettre à chacun d’accéder à l’information, à la connaissance, quelle que soit la langue dans laquelle elle a été codée, et l’incapacité à avoir accès à une langue que l’on ne connaît pas pouvant être assimilée à un handicap.


Alors comment renforcer la présence de langues minoritaires sur le net, et comment fait-on ? Déjà beaucoup de langues qui sont parlées minoritairement, de petites langues en nombre de locuteurs, sont parlées dans des endroits où il n’y a pas d’ordinateurs, pas d’accès internet et parfois même pas d’électricité. Ce n’est pas forcément le cas pour les langues d’outre-mer, mais d’autres questions se posent de façon cruciale, comment fait-on pour poster des contenus sur internet quand la langue n’est pas codifiée ? Si elle est codifiée, combien de personnes savent l’écrire ? Et quand on sait l’écrire, qui va contribuer, parce qu’il faut du temps pour contribuer sur internet ? Ces populations ont généralement un nombre de locuteurs relativement bas, les langues ne sont pas forcément codifiées, pas forcément écrites et il faut encore que les locuteurs se saisissent de leur langue et produisent des contenus pour internet. Cela fait beaucoup de « il faudrait que » et, très souvent, ces communautés ont d’autres priorités que de poster des contenus sur internet. Ce sont des questions qui se posent, on a pas forcément les réponses mais en tous cas, ce qu’on fait nous à Sorosoro, c’est qu’on exploite une autre voie qui est celle de l’audiovisuel, qui suit un schéma de tradition orale puisque notre objet est d’envoyer sur le terrain, un peu partout dans le monde, des équipes filmer ce qu’on espère être la substantifique moelle de ces langues et des cultures qu’elles véhiculent bien entendu. Donc nous partons sur le terrain, avec des linguistes et des anthropologues parfois, et nous ramenons des dizaines d’heures de rushes qui sont tout ce que l’on peut collecter de [[w:Tradition orale|tradition orale]] : des [[w:Conte|contes]], des [[w:Récit|récits]], des [[w:Rite|rites]], de la [[w:Pharmacopée|pharmacopée]], des connaissances diverses et variées, des savoir-faire, la vie quotidienne etc… Puis tout cela est dérushé, archivé, indexé, déposé à l’[[w:Institut national de l'audiovisuel|INA]] et toute une partie de cela est montée et mis en ligne sur internet sur notre site internet qui s’appelle http://www.sorosoro.org/ que certains d’entre vous connaissent ici probablement.
Cette première liste d’applications possibles pourra être complétée à l’aide d’une enquête auprès des utilisateurs potentiels.


Alors nous avons déjà, notamment grâce à la DGLFLF, commencé à travailler sur les outre-mer et espérons pouvoir poursuivre, nous avons filmé en Nouvelle-Calédonie, merci Claire Moïse qui était la linguiste qui accompagnait notre équipe de tournage, merci aussi à l’[[w:Académie des langues kanak|Académie des Langues Kanak]] qui a effectué les traductions en [[w:Xârâcùù|xârâcùù]] puisque nous avons filmé trois langues kanak, le xârâcùù, le [[w:Xârâgurè|xârâgurè]] et le [[w:Xâmea|xâmea]], vous pouvez d’ailleurs voir dans le hall d’entrée des vidéos qui passent sur Sorosoro, sur la construction des cases, mais aussi sur les bébé lecture dont parlait Marie Adèle Jorédié, et on la voit avec ses enfants.
===Considérations générales===
Le travail que nous faisons sert à la recherche mais peut également servir à l’enseignement ou l’accompagnement à l’enseignement des langues, puisqu’on filme à chaque fois des tas de petits mots de la vie quotidienne, on fait donner les chiffres de un à dix, les couleurs, les jours de la semaine, les parties du corps, toutes ces choses qui peuvent être utilisées dans un cadre d’enseignement, de transmission de la langue et puis toute cette tradition orale que l’on filme et qu’on met en ligne progressivement peut également servir pour transmettre tous ces savoirs et cette tradition orale à tous ceux qui sont désireux de les apprendre. Internet sert également à cela. Nous avons également filmé cet été, avec Maurice Tiouka, dans sa propre communauté [[w:Kali'na|Kali'na]] en Guyane, qui sera en ligne après un long processus de traduction.
Voilà, nous espérons pouvoir continuer ce travail, je vous invite à aller voir sur le site pour mieux comprendre ce que nous faisons, qui n’est pas une solution universelle mais qui contribue à cette présence des langues de l’outre-mer et, au-delà, de toutes les langues en danger dans le monde sur internet.


:''Merci. Marcel Diki Kidiri vous faites partie du Réseau Maaya qui essaye de mesurer la présence des langues sur internet.''
D’un point de vue général, et comme dans d’autres ateliers, l’importance de veiller à la reconnaissance, au respect, à la légitimité de toutes les langues a été soulignée, avec le sentiment que les technologies peuvent aider à y parvenir en simplifiant leur coexistence et leur intercompréhension.


==Expert 2 : Marcel Diki Kidiri ([http://maaya.org/spip.php?article12 Groupe MAAYA])==
Il a également été dit qu’il n’était pas nécessaire d’attendre l’arrivée de ces technologies avancées pour déjà utiliser les technologies actuelles afin de promouvoir le plurilinguisme, par exemple dans les émissions radio ou télédiffusées, ou sur les sites Web institutionnels.
[[File:Marcel Diki Kidiri.png|thumb|Marcel Diki Kidiri]]
En 2005 à l’occasion du [http://www.itu.int/wsis/index-fr.html sommet mondial pour la société de l’information] qui s’est tenu à Tunis a été créé à l’initiative de l’[[w:Académie africaine des langues|Académie Africaine des Langues]], le réseau Maaya qui est un réseau mondial pour la diversité linguistique. Maaya est un mot [[w:Mandingue (langue)|mandingue]] qui se traduit en français par humanitude et en [[w:Langues bantoues|langue bantoue]] par un mot qui renvoie à la divinité de l'homme. Depuis sa création, ce réseau a organisé un forum international à Bamako en 2007 sur la diversité linguistique dans le monde et quatre symposium internationaux, deux en [[[w:Russie|Russie]], un à [[w:Barcelone|Barcelone]] et un à [[w:Brasilia|Brasilia]] sur la diversité linguistique dans le cyberespace. La question de la diversité linguistique dans le cyberespace est très présente dans les activités de Maaya qui est entrain de mettre en chantier un très ambitieux programme de création ou de production d’un nouveau moteur de recherche pour une meilleure mesure de la diversité linguistique dans le cyberespace.


Dans la mesure où Google n’est plus du tout capable de le faire et les moteurs de recherche actuels ne donnent pas l’image de la réalité de l’internet. Ceci est confirmé par nos collègues de Maaya mais également l’[[w:Université technique de Nagaoka|université de Nagaoka]] au [[w:Japon|Japon]] qui observe aussi la diversité des langues dans le cyberespace. Je remercie la DGLFLF de m’avoir invité ici au nom de réseau Maaya pour vous parler un peu de ce que nous faisons.
Enfin, il est apparu que l’effort visant à couvrir l’ensemble des langues de France pouvait être partagé conjointement entre l’État et les collectivités locales et territoriales, voire avec la contribution du secteur privé, puisque celui-ci pourra ainsi également mieux satisfaire ses usagers.


Je veux vous parler de mon intérêt pour les langues dans le cyberespace. Cela m’est venu du fait, qu’au départ, j’étais uniquement linguiste africaniste décrivant la langue [[w:Sango|Sango]] de la [[w:République centrafricaine|République Centrafricaine]] qui est aujourd’hui une des deux langues officielles du pays, le Sango et le Français et, avant de devenir langue officielle, le Sango était considérée comme une non-langue et le chemin a été très long pour qu’elle devienne, aujourd’hui, langue officielle.
==Atelier : Présence et dialogue des langues et des cultures sur internet.==
En 1991 j’ai créé un premier site sur le Sango en me disant, personne ne le lira, je le fais pour moi. Trois mois après je reçois des mails du [[w:Canada|Canada]], du Japon, de France, de gens qui étaient émus de voir le Sango sur internet. J’étais très surpris de voir que des gens pouvaient s’intéresser à cette langue. Cela m’a beaucoup encouragé à dire comment on peut faire pour mettre sur internet une langue inconnue pour qu’elle devienne connue. Bien sûr l’internet de 1991 n’est pas celui d’aujourd’hui où tout site digne de ce nom est interactif et social. En 1991 n’importe qui pouvait créer une page internet et mettre sa langue dessus. C’est comme si on mettait un poster sur des murs. Cela fait de ma langue une langue morte sur internet. Pour qu’elle devienne langue vivante, il faut qu’il y ait derrière une communauté. Des gens qui s’écrivent, se répondent, qui réagissent. Donc il faut la formation d’une ressource humaine, d’une communauté qui communique et travaille dans cette langue. Avant même de mettre cette langue sur internet il faut qu’elle soit écrite. Si elle n’est pas écrite, il faut passer par des techniques de reconnaissance vocale qui ne sont pas à la portée de tout le monde, c’est réalisable mais il faut des spécialistes pour le faire. Une fois que la langue est écrite, vous savez tout le débat que l’on a à se mettre d’accord sur une orthographe, il faut pouvoir collecter des textes, créer des forums de discussions.
Modérateure : Rodica Ailincai ([[w:Université de la Polynésie française|IUFM de l'université de la Polynésie française]])


J’ai été amené à écrire cet ouvrage qui est diffusé en [[w:portugais|portugais]], en [[w:russe|russe]], en français, en [[w:anglais|anglais]] et en [[w:espagnol|espagnol]] « [http://www.unesco.org/new/fr/communication-and-information/resources/publications-and-communication-materials/publications/full-list/securing-a-place-for-a-language-in-cyberspace/ Comment assurer la présence d'une langue dans le cyberespace ?] ». Moi je suis parti d’une langue très petite, parlée par deux ou trois personnes, dans la mesure où ces deux ou trois personnes sont décidées à la faire connaître, il faut développer les ressources linguistiques — décrire la langue, écrire la grammaire, écrire les dictionnaires — et aussi traduire le vocabulaire technique pour qu’elle puisse être vivante sur internet, comment on dit naviguer, cliquer,… ce sont des métaphores qu’on doit culturellement intégrer.
Rapporteur : Thibault Grouas ([[w:Délégation générale à la langue française et aux langues de France|Délégation générale à la langue française et aux langues de France]])


Il faut également développer les ressources culturelles. Les gens qui parlent cette langue ont une culture. Comment faire pour transmettre cette culture pour faire partager cela ? Hier j’étais très heureux de voir l’excellence du spectacle fourni par ces enfants. Je me suis dit, y a t-il un moyen de le mettre sur internet pour que ce soit partagé jusqu’au fin fond de l’univers ? Ce que les enfants ont dit est universel. Comment constituer les ressources culturelles locales sous un format partageable sur internet ? Il y a donc la langue, les ressources linguistiques, les ressources culturelles et ensuite les ressources humaines, former les gens pour qu’ils puissent travailler avec internet et enfin, développer les technologies pour l’accès.
===Thèmes de travail===
*Adapter les politiques d'aménagement du territoire pour une meilleure prise en compte du numérique et de l'accès à l'internet.
*Développer les partenariats en milieu scolaire pour sensibiliser à l’usage des langues minoritaires sur l’internet.
*Encourager la productivité en langues locales sur les réseaux de télécommunication mobile et sur les réseaux sociaux.
*Inciter les citoyens et les acteurs privés et publics de l'outre-mer à participer aux projets de traduction des réseaux sociaux les plus courants afin de stimuler leur usage au sein de la population.


===Questions et préconisations à débattre===
*Comment mettre les nouvelles technologies de l’information et de la communication au service du développement des langues de l’outre-mer ?


:''Merci Marcel Diki Kidiri . Le représentant de l’institution auquel nous avons demandé d’apporter son point de vue à cette table ronde est chargé de la publication au Centre National de Documentation Pédagogique et s’intéresse particulièrement au support virtuel.''
*Comment favoriser la production de contenus écrits et oraux en langues autochtones sur l’internet, sous différentes modalités ?


==Représentant de l'institution : Bruno Dairou ([[w:Centre national de documentation pédagogique|Centre national de documentation pédagogique]])==
*Encourager et accompagner la participation citoyenne aux projets collaboratifs de type encyclopédique (Wikipédia...) ou terminologique (wiktionnaire, [http://wikilf.culture.fr/ wikilf]) dans les langues locales.
[[File:Bruno Dairou.png|thumb|Bruno Dairou]]


Le représentant de l’institution est là, très modestement, pour vous dire que justement, tout ce qu’on a développé autour de l’enseignement des langues est finalement très proprement enrichi par les langues régionales. Et, évidemment, pour différentes raisons, sans doute le poids de l’enseignement de la langue française dans le socle commun, des motifs politiques, des motifs linguistiques bien sûr avec une insuffisante description des langues, donc on vient plutôt dans l’idée de voir comment on peut travailler ensemble, beaucoup plus qu’on ne l’a fait jusque là.
*Mettre à disposition des usagers une plate-forme de débat sur la terminologie et l'enrichissement des langues de France, de façon analogue à l'initiative wikilf, qui a rencontré un franc succès en ce qui concerne la langue française.


Pour autant, ce n’est pas négliger la place des langues sur internet et dans les nouvelles technologies. En tous cas, le CNDP s’est saisi à bras le corps de tout cela et pour plusieurs raisons. D’abord, bien évidemment, parce que la demande était forte.
*Encourager l'utilisation des réseaux sociaux ([[w:Facebook|facebook]], [[w:Twitter|twitter]]...) pour favoriser la création littéraire et artistique et la dissémination des œuvres, la maitrise de l'expression écrite, assurer aux langues de France leur maintien et leur vitalité.
Il y avait à la fois une nouvelle façon d’enseigner les langues vivantes et il y avait, de manière complémentaire, le problème du français langue étrangère, langue seconde, langue de scolarisation. Cet ensemble a fait qu’il a fallu développer des outils. Ces outils qui nous posent des tas de problèmes et je pense qu’il faut se parler franchement, de validation des contenus, il est certain que c’est de la qualité pédagogique qu’il nous faut sur ces outils, donc des circuits de validation. Le CNDP fournit les ressources pour les enseignants donc il faut que ces contenus soient validés, fiables et qu’on arrive à les reproduire et les utiliser.


On a développé des outils, je pense - en vous laissant de côté tout ce qui sera les tableaux blancs interactifs - au fait de remplir les espaces numériques de travail qui a occupé beaucoup de forces vives au CNDP, en matière de langues vivantes, et cela a décentré la position de l’enseignant dans la classe. Donc ce n’était plus un dispositif frontal, c’était une utilisation active de ces méthodes grâce aux nouvelles technologies. Ce qui a permis de nouveaux rebonds, d’utiliser et de créer de nouveaux outils, tablettes numériques que nous fournissons très pauvrement en contenus, nous n’en sommes qu’au début et, ce matin dans les ateliers, cela a été évoqué très richement et il faudrait que l’on puisse évoquer des partenariats, mais il y a aussi ce que l’on appelle et que nous tirons de chez nos amis canadiens, la [http://eduscol.education.fr/langues/usages/baladodiffusion baladodiffusion], donc le fait qu’on utilise désormais ce qui est de l’univers des élèves, donc la possibilité de descendre de l’information sur leurs baladeurs, que ce soit en audio ou vidéo, que ce soient eux-même qui génèrent le flux. Donc le CNDP fournit des ressources dans ces domaines. Mais ce qui est intéressant et qu’on doit essayer de bâtir ensemble, et cela ressortait des ateliers de ce matin, c’est d’aboutir à des ressources et là aussi, je crois qu’il y a des partenariats à bâtir.
*Stimuler l'émergence de communautés virtuelles structurées autour de pratiques langagières parfois menacées


Cela ne veut pas dire qu’il n’y a rien d’existant, les CRDP ont beaucoup travaillé sur des ouvrages imprimés, mais aussi pour fournir des contenus numériques. L’intérêt pour nous, serait de travailler ensemble et je vous dis ce que le CNDP développe, nous développons les télévisions permettant d’aborder l’étude des langues, on essaye de le généraliser mais je crois qu’il y aurait un travail en commun à faire, des projets voient le jour, de plateformes de vidéo qui restent à nourrir, et il y aurait la possibilité d’introduire les langues régionales de manière pertinente, les langues en ligne, nous avons des séquences nombreuses, mais sur les langues régionales cela reste encore à développer et à bâtir. C’est le cas aussi de sites gratuits très consultés, plus d’un million de clics par an, sur lesquels la place des langues régionales reste à faire.
*Renforcer les travaux autour des archives vocales pour constituer un corpus significatif et accessible à tous, dans une grande variété de langues, au sein du projet « [http://corpusdelaparole.in2p3.fr/ corpus de la parole] » du [[w:Ministère de la Culture (France)|ministère de la Culture et de la Communication]].
C’est vous dire que le CNDP est partie prenante de cela et on continue d’accompagner les langues des outre-mer mais c’est à l’état embryonnaire et je crois que cela peut être un effet de ces états généraux, se dire qu’il est grand temps qu’on travaille plus grandement ensemble.


===Débat avec les participants===
[[w:Guadeloupe|Guadeloupe]] : médiathèque, atelier de maitrise des langues. Mettre en ligne les ateliers en langue locale sur le portail ?
traducteur guadeloupéen : créole très peu utilisé comme langue de discussion sur internet, le chat...


==Vos réactions sur cette table ronde==
le [[w:Short Message Service|SMS]] : l'orthographe s'apparente beaucoup au créole. Pratique orthographique du fran-créole. Ce n'est pas un signe de réussite sociale de parler le créole. Les références écrites sont le français, très mauvaise image du créole.
comment faire connaitre les cultures sur internet ? Quelle mise en valeur de l'artisanat dans les langues locales ?


[[w:La Réunion|La Réunion]] - étude sur les SMS et le chat : le créole est très utilisé avec une très grande liberté d'écriture. Première génération qui assume. Ce sont des espaces de jeu ouverts et procurant le plaisir de pratiquer la langue.
Par exemple : un site expliquant que l'origine culturelle provient de l'identité linguistique.
Responsable d'un site caraïbe [[w:Créole guadeloupéen|créole guadeloupéen]] : problème de référencement avec Google. Les articles en créoles ne sont pas lus. Google favorise les langues les plus présentes.


[[Catégorie:États généraux du multilinguisme dans les outre-mer]]
-> Se mettre en relation avec Google pour améliorer ce point.

-> Il est plus facile de mettre des vidéos ou de la musique car les ados ne lisent pas le créole mais vont écouter la musique et regarder les vidéos.

-> Trouver des méthodes plus ludiques :
Un professeur en Guyane propose d'associer l'apprentissage de la langue à la rédaction d'articles sur internet.

-> Cela permettrait de créer des communautés de débat avec les jeunes :
Expérience de dialogue avec des enfants ne parlant pas français sur internet, écrivez comme cela vous vient à l'esprit. Meilleure progression en français grâce aux technologies.

-> Enseignement à distance pour éviter l'absentéisme.
Par exemple : [http://www.krakemanto.gf/ krakémento.gf] : site en créole guyanais.
Aménagement du territoire : internet disponible sur le territoire indien en Guyane. Recenser les différents lieux d'accès. Les écoles ne sont pas suffisamment connectées à internet. Réticences.
Traduction de séries pour ados sur youtube en créole guyanais et bushi nengué : référencement à faire car beaucoup de choses.
Facebook : les gens sont choqués quand on s'exprime en créole !! remarques désobligeantes. "la technologie doit être en français". Vrai complexe d'utiliser les technologies autrement qu'en français.
Terminologie du site : il a créé sa propre terminologie, mais il faudrait créée une base de données harmonisée pour tous ces termes.
Proposition : veiller à l'accès à internet dans les écoles. Outil indispensable pour une meilleure éducation à l'écrit. Il faut des outils qui fonctionnent.
Besoin de logiciels de traduction orale ? Il faut d'abord structurer les besoins et trouver une démarche d'originalité. Technologies à expérimenter : ce peut être utile.
[[w:Académie des langues kanak|Académie des langues kanak]] : outils développés : [http://www.alk.gouv.nc/portal/page/portal/alk/ www.alk.nc.]] diffusion des caractéristiques phonétiques des langues, pages de présentation des langues disponibles en langue locale et français. Encart presse hebdo en langue kanak. Outils pédagogiques et supports pour les langues kanaks mis en ligne, échange entre les enseignants.
Des outils différents : entre réseau social et site officiel, cela n'a rien a voir. Recherche de contenu = nécessité de produire.

-> Le collaboratif suffit-il ? Nécessité d'aide du ministère de la Culture et de la Communication, du [[w:Centre national de documentation pédagogique|CNDP]] pour faire des contenus utilisables dans le cadre pédagogique.
Savoirs faire traditionnels : fabriquer des pirogues par exemple, comment fabrique-t-on le manioc ? La langue locale pourrait être beaucoup plus adaptée car richesse d'expression (exemple du breton avec la marée). Nécessité de faire des fiches techniques sur les cultures.

-> Former des créateurs de site maitrisant la langue locale. Projets intéressants :
[[w:Hmong|Hmong]] : la lecture chez les jeunes est de moins en moins répandue. Le choix de la traduction automatique n'est pas bon, en revanche le sous titrage est une bonne idée.
Animateur radio [[w:Palikur|palikur]] : facebook très utilisé et [[w:MSN|MSN]] aussi en [[w:Palikur (langue)|palikur]], c'est une langue déjà écrite. La bible a été traduite en palikur ce qui a beaucoup aidé. Comment traduire ces langues vers le français ? Ou trouver des traducteurs ?

-> Cela a permis l'émergence d'une communauté sur internet, d'une véritable communauté. Mais exclue des non pratiquants du français.
Priorité : un dialogue sur internet entre communauté de locuteurs palikur, bushi ningue... la traduction n'est pas forcément la solution : il faut se décomplexer. Cela ne représente pas une forte valeur ajoutée.
Le dialogue entre communautés est très important : il permet de partager des choses que l'on ne partagerait pas forcément en français. INTIMITE CULTURELLE
quelques sites en kalinien.
Il faut segmenter par âge pour proposer des offres intéressantes. Promouvoir le phénomène communautaire.
Professeur de créole : formation des jeunes très importante. Volonté de s'exprimer en créole par écrit : sentiment de liberté associé à la langue. Mais il faut éviter les interdits.
Pas de formation de [http://kapeskreyol.potomitan.info/ CAPES de créole] en Guyane : impossible d'enseigner, du coup l'enseignant est hésitant et réticents à utiliser le créole.
Inventaire des ouvrages à faire et des œuvres traduites.
Donner le choix au visiteur de choisir sa langue.
Le cout est très bas et permet de toucher un large public : très important.

==Atelier : Atelier d’écriture [[w:Wikipédia|Wikipédia]].==
Modérateurs : Adrienne Alix et Guillaume Goursat ([http://www.wikimedia.fr/ Wikimédia France])

Rapporteur : Jean-marc Rosier (Traducteur [[w:Martinique|Martinique]])

===Résumé===
L'atelier a rassemblé un petit groupe d'une dizaine de personnes autour d'Adrienne Alix, directrice des programmes de Wikimédia France, et Guillaume Goursat, membre de Wikimédia France (Wikimédia France est une association française dont l'objectif est de soutenir et promouvoir Wikipédia et les projets Wikimédia sur le territoire français, dans toutes les langues présentes sur le territoire). 


L'atelier a commencé sur le constat, exposé dans le rapport sur « L'outre-mer sur les projets Wikimédia », que les langues d'outre-mer sont encore très peu présentes sur des projets majeurs et extrêmement consultés de par le monde, comme Wikipédia ou le [[w:Wiktionnaire|Wiktionnaire]]. Il n'y a par exemple que deux versions de Wikipédia en langues d'outre-mer. Le Wiktionnaire francophone, qui contient des définitions de mots de 987 langues, ne compte pas d'alternative en langue d'outre-mer. 


Pourtant, les projets Wikimédia peuvent être un outil fondamental et populaire de transmission, légitimation, diffusion et stabilisation des langues. Participer à un projet collaboratif de transmission des connaissances peut aider à lutter contre un certain « complexe » des langues principalement orales et servant à décrire l'informel. Ce constat, fait au cours des sessions et des discussions avec les différents intervenants, que les langues d'outre-mer n'étaient pas forcément utilisées pour transmettre des connaissances « savantes » et que cela freinait leur appropriation et leur transmission. 



L'atelier a montré concrètement comment contribuer sur Wikipédia, se créer un compte, et quelles étaient les étapes nécessaires à la création d'une version linguistique de Wikipédia. Il s'agissait avant tout de lever certaines barrières dues à la méconnaissance du fonctionnement de Wikipédia, et de susciter l'envie de créer des versions de Wikipédia en langues locales, en fournissant les informations de base et les contacts utiles. 



===Préconisations===

*Les projets Wikimédia pourraient donc être utilisés pour transmettre la connaissance, locale et générale, dans les langues d'outre-mer et langues maternelles des locuteurs des territoire d'outre-mer, tout en faisant en même temps un travail de valorisation des cultures, savoirs et traditions d'outre-mer sur les projets Wikimédia en français.

*L'atelier s'est conclu sur l'idée que la DGLFLF pourrait être, notamment par son volet d'accompagnement numérique, un interlocuteur conjoint, avec Wikimédia France, auprès des communautés linguistiques d'outre-mer, pour apporter une aide et un soutien à la création et au développement de versions des projets Wikimédia en langues d'outre-mer, afin de favoriser le rayonnement et le développement de l'outre-mer sur le cinquième site internet au monde, et premier site culturel et à but non lucratif. 



Ce sera donc le sens de la recommandation exposée à la fin des états généraux du multilinguisme dans les outre-mer :

*utiliser le vecteur des projets collaboratifs et libre Wikimédia, et spécialement Wikipédia et le Wiktionnaire, pour faire vivre sur internet les langues d'outre-mer et favoriser la diffusion mondiale des richesses de l'Outre-Mer. 

Liens utiles : 
- Le site de l'association Wikimédia France [http://www.wikimedia.fr] 
- Le rapport « L'outre-mer sur les projets Wikimédia » [http://www.wikimedia.fr/%C3%A9tudes-et-rapports] 
- Comment débuter sur Wikipédia [http://www.wikimedia.fr/sites/default/files/Bienvenue_sur_Wikipedia.pdf] (pdf)





Version du 20 avril 2012 à 18:10

Présentation générale

Internet et les technologies du numérique offrent de nouvelles opportunités pour la vitalité des langues, leur valorisation, leur transmission et leur enseignement. Les technologies de la langue, si elles sont développées pour les langues régionales, sont de nature à répondre aux besoins d’aide à la traduction et à l’interprétation pour les usagers des services publics. Dans cette perspective, il était nécessaire de faire un point sur la nature et l’avancée des technologies de la langue, de mener une réflexion sur la façon dont elles pourraient être utilisées pour faciliter le multilinguisme et d’évaluer la nature et la taille de l’effort à effectuer pour doter les langues d’outre-mer de telles technologies. Le développement de la diversité culturelle et linguistique sur internet nécessite également une meilleure connaissance de la présence des langues sur internet, ainsi qu’un accompagnement pour la constitution de réseaux sociaux et de communautés de locuteurs.

Propos introductif : Adrienne Alix (Wikimédia France)

Fichier:Adrienne Alix.png
Adrienne Alix

Je vais vous parler ici avec un regard très naïf et qui découvre, je ne suis ni spécialiste des langues, ni des outre-mer, par contre, un peu plus du numérique et je vais essayer d’introduire cette deuxième table ronde en montrant un peu les opportunités et l’intérêt du numérique et d’internet pour la valorisation, la préservation, la diffusion des langues d’outre-mer tout en vous faisant part de mon étonnement, ce matin, de ne pas avoir vu ou entendu parler à aucun moment d’internet ou de quoi que ce soit qui puisse faire penser au numérique. Cela me démangeait d’en parler et je me suis dit que j’allais attendre cet après-midi pour pouvoir en parler tous ensemble.

Pour schématiser très rapidement, ce qui est pour moi le fondement d’internet, c’est tout d’abord un réseau décentralisé, quelque chose qui, dans sa conception, est totalement indépendant techniquement de toute structure étatique ou autre, cela n’a pas été construit pour ça, c’est quelque chose qui a été fait pour le partage, pour la circulation de l’information, c’est un réseau qui permet l’initiative individuelle et l’initiative collective sans demander à qui que ce soit avant de le faire. C’est donc, à mon sens, un des outils les plus pratiques, un outil idéal pour la diffusion, la préservation et le travail sur les langues.

J’ai entendu, ce matin, beaucoup de réflexions sur les problèmes avec l’institution Éducation nationale par exemple, ou ce qu’on en attend, ce qu’on lui reproche. S’il y a un espace de liberté beaucoup plus grand où l’on a pas à demander ou avoir besoin d’une loi, c’est bien internet. Si vous voulez voir comment on peut faire démarrer une langue rare, une langue peu parlée, peu dotée, comme le dit monsieur Diki Kidiri, je vous invite à lire le rapport qu’il a fait il y a déjà cinq ans, sur comment assurer la présence d’une langue sur le cyberespace et qui, pour moi, était quelque chose d’assez fondamental pour comprendre comment une langue qu’il appelle « peu dotée », avec peu de ressources écrites et peu de ressources numériques, peut avoir sa place sur internet.

Je vais vous parler de quelque chose que je connais plus particulièrement et qui me semble être un excellent vecteur des langues, c’est Wikipédia. Je vais d’abord faire un petit point sur les problématiques que j’ai pu relever sur les langues. Quelle est la place que peuvent prendre les langues d’outre-mer, les langues de France sur Internet ? Il y a un certain nombre de problématiques pas forcément insurmontables mais qui se posent actuellement.

  • La première, c’est la mesure de la place des langues. Mesurer combien il y a de pages web en français, en allemand, en anglais, en créole, dans n’importe quelle langue est quelque chose de difficile. Les moteurs de recherche n’indexent pas toutes les pages. C’est à dire que, sans savoir ce qui existe, c’est difficile de pouvoir promouvoir une langue, donc c’est un des problèmes pour trouver la place des langues sur le numérique. Google, le moteur de recherche le plus pratiqué au monde, ne propose son interface qu’en cent cinquante langues, ce qui n’est pas énorme, et fait un travail sérieux de résultats de moteur de recherche qu’en environ trente cinq langues, donc on est très loin de pouvoir faire émerger la diversité.
  • Deuxième problématique importante, celle de la fixation écrite de la langue, qui n’est pas spécifique au numérique mais qui se pose forcément sur internet puisque internet est principalement un internet écrit.
  • Troisième point, vouloir faire exister une langue sur internet nécessite une traduction des interfaces des logiciels qui permettent de produire du contenu pour qu’il y ait une réelle appropriation par les locuteurs.
  • Et puis, dernier problème, beaucoup plus pratique, celui de la connexion à internet qui n’est pas forcément très évidente suivant là où l’on se trouve.

Donc, les bases d’un multilinguisme sur internet assumé, où on puisse s’exprimer sans aucun problème, ne sont pas forcément simples, mais on a quand même la possibilité, pour chaque langue, de trouver sa place, si elle est portée par une communauté de locuteurs active, motivée et qui intègre les enjeux du numérique pour la diffusion d’une langue en dehors d’une communauté.

J’en arrive maintenant au sujet que je connais le mieux et qui me semble être un bon exemple de multilinguisme, qui est l’encyclopédie Wikipédia que vous connaissez probablement en français, en anglais, peut-être moins dans d’autres langues, et qui a la particularité d’être collaborative, ouverte à tous, il n’y a pas de barrière à l’écriture pour tous ceux qui veulent contribuer, qui est diffusée sous une licence libre qui permet donc une réelle diffusion, redistribution, réappropriation, remixage, sous n’importe quel support et qui est, dans son essence même, multilingue, c’est-à-dire qu’on n’est pas dans un concept de traduction d’une langue à l’autre, mais de développement totalement autonome de chaque langue, à partir du moment où elle a une communauté de locuteurs qui a pris en charge la création d’une version linguistique de l’encyclopédie. Pour vous donner une idée, en dix ans, on est passé du Wikipédia en anglais né en 2001 à 283 éditions linguistiques totalement autonomes, dont une quarantaine ont plus de cent mille articles, et qui comportent des langues extrêmement parlées mais aussi des langues extrêmement peu parlées suivant la communauté qui va la porter. En français on est à un million deux cent mille articles.

Autour de Wikipédia gravitent d’autres sites qui sont d’autres moyens de couvrir les champs du savoir, les champs de la culture et de la contribution. Parmi ceux-ci, j’en distingue trois, une médiathèque qui s’appelle Wikimédia commons qui héberge tous les fichiers multimédias, vidéos, photos, qui n’est pas multilingue mais unilingue avec des interfaces, par contre, dans différentes langues, et qui compte plus de onze millions de fichiers, Wikisource qui existe dans une cinquantaine de langues et qui est une bibliothèque de textes sous licences libres ou dans le domaine public et puis, le Wiktionnaire dont je vous parlerai plus longuement tout à l’heure qui est un dictionnaire multilingue qui existe dans plusieurs dizaines de langues et qui, en français, compte plus de deux millions d’entrées. Quelle est la place des langues d’outre-mer sur Wikipédia ? C’est une présence extrêmement faible. On a que deux langues qui ont une version linguistique autonome de Wikipédia réellement active, le tahitien et le créole haïtien, avec assez peu d’articles quant on compare avec d’autres langues. Trois versions linguistiques sont en cours de création, à un tout premier stade, le créole guadeloupéen qui ne compte que quatre articles encyclopédiques, ce qui, rapporté au nombre de locuteurs potentiels, est très faible, le hmong et le wallisien. Alors est-ce que la solution serait d’adopter une démarche de traduction systématique qui n’est pas la démarche originelle de Wikipédia, et de faire travailler les gens systématiquement en français et dans leur langue, pour créer des contenus dans les langues d’outre-mer sur tous types de sujets encyclopédiques et aussi créer des contenus en français sur les thématiques de l’outre-mer ? Pour vous donner une image de ce qui peut se faire dans l’autre sens, sur Wikipédia en français, en revanche, l’outre-mer est très présent. On a à peu près 6000 articles qui concernent très précisément les outre-mer, cela va de 60 articles pour Wallis et Futuna à 2400 pour la Réunion, c’est donc très disparate mais très comparable au traitement des autres régions françaises, rapportée au nombre d’habitants la couverture des sujets sur l’outre-mer est plutôt bien faite alors qu’à l’inverse, la couverture de n’importe quel sujet n’est absolument pas faite dans les langues locales. Peut-être que le préalable à l’écriture encyclopédique et le partage du savoir encyclopédique dans les langues locales doit se faire d’abord par la mise à disposition de plus de vocabulaire écrit, d’un dictionnaire plus accessible à tous. Un des projets Wikimédia, le Wiktionnaire, est intéressant dans son approche multilingue. Il va exister dans plusieurs dizaines de langues et, en français, va donner des définitions de mots de différentes langues. Pour vous donner un exemple, le Wiktionnaire francophone compte un peu plus de deux millions de définitions et propose des définitions de ces mots dans 987 langues différentes. 14 langues d’outre-mer sont représentées, plus que dans Wikipédia et dans ces principales langues on retrouve le tahitien, le créole haïtien et celui de Guadeloupe. A noter que certaines langues comme le malgache ont un Wiktionnaire extrêmement fourni, bien plus que d’autres langues bien plus dotées. Donc ce Wiktionnaire est une aide au travail d’écriture des langues, de traduction, de transcription d’une langue à une autre et je me pose la question de savoir si ça ne serait pas un préalable à la création de contenu encyclopédique, c’est-à-dire d’abord décrire les mots et, une fois ces mots décrits, une fois les concepts posés, pouvoir ensuite entamer ce travail encyclopédique qui pour l’instant n’existe pas vraiment.

Pour terminer, quelques questions avant les ateliers, sur la place des langues sur le numérique, quelle est la place écrite de ces langues ? Je pense que c’est l’un des points fondamentaux, comment écrire, comment avoir une graphie commune ? Est-on obligé d’avoir cette stabilisation écrite pour aller sur internet ou y a-t-il un moyen de faire autrement ? Comment donner de la visibilité à une langue ? Et est-ce que, pour vous, la valorisation de la langue par le numérique est quelque chose de naturel qu’il convient de développer ou pas ? Qui est à même de prendre en charge ces actions, est-ce à l’État ou aux individus ? Les pratiques sur internet sont des pratiques individuelles ou par communauté plutôt que des pratiques étatiques, êtes-vous prêts ou motivés pour prendre en charge des actions de valorisation sur le numérique ? Enfin, est ce que cette démarche de co-construction par la traduction systématique français et langue locale pour faire progresser les contenus dans les deux langues et faire progresser la connaissance et la langue dans les deux langues est ce une bonne solution ? En tous cas, sachez que l’association Wikimédia France pour laquelle je travaille et qui s’occupe de valoriser et diffuser Wikipédia sur le territoire français et non pas forcément que en langue française, est tout à fait disposée à vous aider si vous avez une envie de valoriser vos langues sur Wikipédia et on aura tout à l’heure, dans un atelier, l’occasion d’entrer plus en détail dans cela. Voilà, pour ma part, la réflexion que je me faisais sur le numérique.


Merci Adrienne. Rozenn Milin de l’Association Sorosoro, je vous donne la parole.

Expert 1 : Rozenn Milin (SOROSORO)

Fichier:Rozenn Milin.png
Rozenn Milin

Je vais essayer d’être brève pour vous parler de Sorosoro. C’est un programme qui travaille à la sauvegarde des langues en danger sur des supports audiovisuels et numériques, pas seulement sur l’outre-mer, c’est un programme généraliste qui s’occupe de toutes les langues du monde, mais qui a aussi travaillé sur l’outre-mer, la Guyane et la Nouvelle-Calédonie en particulier, grâce à la DGLFLF du ministère de la Culture et de la Communication qui nous accueille ici et encore merci de cette invitation.

Le sujet est donc ici, la présence des langues sur la toile et les réseaux sociaux. J’ai pensé qu’il fallait remettre tout cela en contexte même si cela a été fort bien fait par Adrienne et que Marcel le fera également, je vais juste reprendre les critères qui sont donnés par les experts de l’UNESCO pour évaluer les critères de vitalité des langues. Il y a bien sûr le nombre de locuteurs, il y a aussi la transmission de génération en génération, on a beaucoup évoqué la Bretagne je suis bretonne, je parle breton et j’en sais quelque chose de ce problème de transmission quand la majorité des locuteurs a plus de soixante ans et qu’elle ne transmet plus sa langue, c’est que la langue est très mal en point, la présence de l’éducation est, bien sûr, un sujet majeur, mais il y a aussi la présence dans la vie publique qui est un des critères retenus par l’UNESCO pour déterminer la vitalité des langues. Qui dit vie publique, dit beaucoup présence dans les médias, alors si on reprend chronologiquement, il y avait la presse écrite, il y a eu la radio, la télé et aujourd’hui internet qui bouleverse un peu tout. Si je reprends quelques chiffres de 2008 d’une étude de TNS Sofres qui dit que la consommation moyenne par français de télévision par jour était, en 2008, de trois heures et sept minutes. Dans le même temps, la consommation internet de loisirs était de deux heures dix sept minutes par jour. Aujourd’hui on est passé à trois heures trente pour la télévision et je n’ai pas le chiffre pour internet, mais on est très certainement proche du même temps en consommation internet qu’on l’est en consommation télévisuelle. C’est dire si le monde des médias est en train d’être bouleversé et il est clair que, pour des langues minoritaires, pour qu’elles aient une chance de survivre à l’avenir dans ce monde qui est très technologique et globalisé, il faudra être présent sur internet. Je peux vous donner un autre chiffre qui n’est pas récent mais je ne pense pas qu’il ait changé beaucoup, quatre vingt dix pourcent des pages disponibles sur internet sont en seulement douze langues. Il est difficile d’avoir des données récentes car tout passe par des moteurs de recherche et Google est un peu avare d’informations, mais s’intéresse de près aux langues en danger puisqu’ils ont l’intention de lancer une plateforme autour de ces langues en début d’année prochaine. C’est donc un sujet qui devient assez chaud.

Alors comment renforcer la présence de langues minoritaires sur le net, et comment fait-on ? Déjà beaucoup de langues qui sont parlées minoritairement, de petites langues en nombre de locuteurs, sont parlées dans des endroits où il n’y a pas d’ordinateurs, pas d’accès internet et parfois même pas d’électricité. Ce n’est pas forcément le cas pour les langues d’outre-mer, mais d’autres questions se posent de façon cruciale, comment fait-on pour poster des contenus sur internet quand la langue n’est pas codifiée ? Si elle est codifiée, combien de personnes savent l’écrire ? Et quand on sait l’écrire, qui va contribuer, parce qu’il faut du temps pour contribuer sur internet ? Ces populations ont généralement un nombre de locuteurs relativement bas, les langues ne sont pas forcément codifiées, pas forcément écrites et il faut encore que les locuteurs se saisissent de leur langue et produisent des contenus pour internet. Cela fait beaucoup de « il faudrait que » et, très souvent, ces communautés ont d’autres priorités que de poster des contenus sur internet. Ce sont des questions qui se posent, on a pas forcément les réponses mais en tous cas, ce qu’on fait nous à Sorosoro, c’est qu’on exploite une autre voie qui est celle de l’audiovisuel, qui suit un schéma de tradition orale puisque notre objet est d’envoyer sur le terrain, un peu partout dans le monde, des équipes filmer ce qu’on espère être la substantifique moelle de ces langues et des cultures qu’elles véhiculent bien entendu. Donc nous partons sur le terrain, avec des linguistes et des anthropologues parfois, et nous ramenons des dizaines d’heures de rushes qui sont tout ce que l’on peut collecter de tradition orale : des contes, des récits, des rites, de la pharmacopée, des connaissances diverses et variées, des savoir-faire, la vie quotidienne etc… Puis tout cela est dérushé, archivé, indexé, déposé à l’INA et toute une partie de cela est montée et mis en ligne sur internet sur notre site internet qui s’appelle http://www.sorosoro.org/ que certains d’entre vous connaissent ici probablement.

Alors nous avons déjà, notamment grâce à la DGLFLF, commencé à travailler sur les outre-mer et espérons pouvoir poursuivre, nous avons filmé en Nouvelle-Calédonie, merci Claire Moïse qui était la linguiste qui accompagnait notre équipe de tournage, merci aussi à l’Académie des Langues Kanak qui a effectué les traductions en xârâcùù puisque nous avons filmé trois langues kanak, le xârâcùù, le xârâgurè et le xâmea, vous pouvez d’ailleurs voir dans le hall d’entrée des vidéos qui passent sur Sorosoro, sur la construction des cases, mais aussi sur les bébé lecture dont parlait Marie Adèle Jorédié, et on la voit avec ses enfants. Le travail que nous faisons sert à la recherche mais peut également servir à l’enseignement ou l’accompagnement à l’enseignement des langues, puisqu’on filme à chaque fois des tas de petits mots de la vie quotidienne, on fait donner les chiffres de un à dix, les couleurs, les jours de la semaine, les parties du corps, toutes ces choses qui peuvent être utilisées dans un cadre d’enseignement, de transmission de la langue et puis toute cette tradition orale que l’on filme et qu’on met en ligne progressivement peut également servir pour transmettre tous ces savoirs et cette tradition orale à tous ceux qui sont désireux de les apprendre. Internet sert également à cela. Nous avons également filmé cet été, avec Maurice Tiouka, dans sa propre communauté Kali'na en Guyane, qui sera en ligne après un long processus de traduction. Voilà, nous espérons pouvoir continuer ce travail, je vous invite à aller voir sur le site pour mieux comprendre ce que nous faisons, qui n’est pas une solution universelle mais qui contribue à cette présence des langues de l’outre-mer et, au-delà, de toutes les langues en danger dans le monde sur internet.


Merci. Marcel Diki Kidiri vous faites partie du Réseau Maaya qui essaye de mesurer la présence des langues sur internet.

Expert 2 : Marcel Diki Kidiri (Groupe MAAYA)

Fichier:Marcel Diki Kidiri.png
Marcel Diki Kidiri

En 2005 à l’occasion du sommet mondial pour la société de l’information qui s’est tenu à Tunis a été créé à l’initiative de l’Académie Africaine des Langues, le réseau Maaya qui est un réseau mondial pour la diversité linguistique. Maaya est un mot mandingue qui se traduit en français par humanitude et en langue bantoue par un mot qui renvoie à la divinité de l'homme. Depuis sa création, ce réseau a organisé un forum international à Bamako en 2007 sur la diversité linguistique dans le monde et quatre symposium internationaux, deux en [[[w:Russie|Russie]], un à Barcelone et un à Brasilia sur la diversité linguistique dans le cyberespace. La question de la diversité linguistique dans le cyberespace est très présente dans les activités de Maaya qui est entrain de mettre en chantier un très ambitieux programme de création ou de production d’un nouveau moteur de recherche pour une meilleure mesure de la diversité linguistique dans le cyberespace.

Dans la mesure où Google n’est plus du tout capable de le faire et les moteurs de recherche actuels ne donnent pas l’image de la réalité de l’internet. Ceci est confirmé par nos collègues de Maaya mais également l’université de Nagaoka au Japon qui observe aussi la diversité des langues dans le cyberespace. Je remercie la DGLFLF de m’avoir invité ici au nom de réseau Maaya pour vous parler un peu de ce que nous faisons.

Je veux vous parler de mon intérêt pour les langues dans le cyberespace. Cela m’est venu du fait, qu’au départ, j’étais uniquement linguiste africaniste décrivant la langue Sango de la République Centrafricaine qui est aujourd’hui une des deux langues officielles du pays, le Sango et le Français et, avant de devenir langue officielle, le Sango était considérée comme une non-langue et le chemin a été très long pour qu’elle devienne, aujourd’hui, langue officielle. En 1991 j’ai créé un premier site sur le Sango en me disant, personne ne le lira, je le fais pour moi. Trois mois après je reçois des mails du Canada, du Japon, de France, de gens qui étaient émus de voir le Sango sur internet. J’étais très surpris de voir que des gens pouvaient s’intéresser à cette langue. Cela m’a beaucoup encouragé à dire comment on peut faire pour mettre sur internet une langue inconnue pour qu’elle devienne connue. Bien sûr l’internet de 1991 n’est pas celui d’aujourd’hui où tout site digne de ce nom est interactif et social. En 1991 n’importe qui pouvait créer une page internet et mettre sa langue dessus. C’est comme si on mettait un poster sur des murs. Cela fait de ma langue une langue morte sur internet. Pour qu’elle devienne langue vivante, il faut qu’il y ait derrière une communauté. Des gens qui s’écrivent, se répondent, qui réagissent. Donc il faut la formation d’une ressource humaine, d’une communauté qui communique et travaille dans cette langue. Avant même de mettre cette langue sur internet il faut qu’elle soit écrite. Si elle n’est pas écrite, il faut passer par des techniques de reconnaissance vocale qui ne sont pas à la portée de tout le monde, c’est réalisable mais il faut des spécialistes pour le faire. Une fois que la langue est écrite, vous savez tout le débat que l’on a à se mettre d’accord sur une orthographe, il faut pouvoir collecter des textes, créer des forums de discussions.

J’ai été amené à écrire cet ouvrage qui est diffusé en portugais, en russe, en français, en anglais et en espagnol « Comment assurer la présence d'une langue dans le cyberespace ? ». Moi je suis parti d’une langue très petite, parlée par deux ou trois personnes, dans la mesure où ces deux ou trois personnes sont décidées à la faire connaître, il faut développer les ressources linguistiques — décrire la langue, écrire la grammaire, écrire les dictionnaires — et aussi traduire le vocabulaire technique pour qu’elle puisse être vivante sur internet, comment on dit naviguer, cliquer,… ce sont des métaphores qu’on doit culturellement intégrer.

Il faut également développer les ressources culturelles. Les gens qui parlent cette langue ont une culture. Comment faire pour transmettre cette culture pour faire partager cela ? Hier j’étais très heureux de voir l’excellence du spectacle fourni par ces enfants. Je me suis dit, y a t-il un moyen de le mettre sur internet pour que ce soit partagé jusqu’au fin fond de l’univers ? Ce que les enfants ont dit est universel. Comment constituer les ressources culturelles locales sous un format partageable sur internet ? Il y a donc la langue, les ressources linguistiques, les ressources culturelles et ensuite les ressources humaines, former les gens pour qu’ils puissent travailler avec internet et enfin, développer les technologies pour l’accès.


Merci Marcel Diki Kidiri . Le représentant de l’institution auquel nous avons demandé d’apporter son point de vue à cette table ronde est chargé de la publication au Centre National de Documentation Pédagogique et s’intéresse particulièrement au support virtuel.

Représentant de l'institution : Bruno Dairou (Centre national de documentation pédagogique)

Fichier:Bruno Dairou.png
Bruno Dairou

Le représentant de l’institution est là, très modestement, pour vous dire que justement, tout ce qu’on a développé autour de l’enseignement des langues est finalement très proprement enrichi par les langues régionales. Et, évidemment, pour différentes raisons, sans doute le poids de l’enseignement de la langue française dans le socle commun, des motifs politiques, des motifs linguistiques bien sûr avec une insuffisante description des langues, donc on vient plutôt dans l’idée de voir comment on peut travailler ensemble, beaucoup plus qu’on ne l’a fait jusque là.

Pour autant, ce n’est pas négliger la place des langues sur internet et dans les nouvelles technologies. En tous cas, le CNDP s’est saisi à bras le corps de tout cela et pour plusieurs raisons. D’abord, bien évidemment, parce que la demande était forte. Il y avait à la fois une nouvelle façon d’enseigner les langues vivantes et il y avait, de manière complémentaire, le problème du français langue étrangère, langue seconde, langue de scolarisation. Cet ensemble a fait qu’il a fallu développer des outils. Ces outils qui nous posent des tas de problèmes et je pense qu’il faut se parler franchement, de validation des contenus, il est certain que c’est de la qualité pédagogique qu’il nous faut sur ces outils, donc des circuits de validation. Le CNDP fournit les ressources pour les enseignants donc il faut que ces contenus soient validés, fiables et qu’on arrive à les reproduire et les utiliser.

On a développé des outils, je pense - en vous laissant de côté tout ce qui sera les tableaux blancs interactifs - au fait de remplir les espaces numériques de travail qui a occupé beaucoup de forces vives au CNDP, en matière de langues vivantes, et cela a décentré la position de l’enseignant dans la classe. Donc ce n’était plus un dispositif frontal, c’était une utilisation active de ces méthodes grâce aux nouvelles technologies. Ce qui a permis de nouveaux rebonds, d’utiliser et de créer de nouveaux outils, tablettes numériques que nous fournissons très pauvrement en contenus, nous n’en sommes qu’au début et, ce matin dans les ateliers, cela a été évoqué très richement et il faudrait que l’on puisse évoquer des partenariats, mais il y a aussi ce que l’on appelle et que nous tirons de chez nos amis canadiens, la baladodiffusion, donc le fait qu’on utilise désormais ce qui est de l’univers des élèves, donc la possibilité de descendre de l’information sur leurs baladeurs, que ce soit en audio ou vidéo, que ce soient eux-même qui génèrent le flux. Donc le CNDP fournit des ressources dans ces domaines. Mais ce qui est intéressant et qu’on doit essayer de bâtir ensemble, et cela ressortait des ateliers de ce matin, c’est d’aboutir à des ressources et là aussi, je crois qu’il y a des partenariats à bâtir.

Cela ne veut pas dire qu’il n’y a rien d’existant, les CRDP ont beaucoup travaillé sur des ouvrages imprimés, mais aussi pour fournir des contenus numériques. L’intérêt pour nous, serait de travailler ensemble et je vous dis ce que le CNDP développe, nous développons les télévisions permettant d’aborder l’étude des langues, on essaye de le généraliser mais je crois qu’il y aurait un travail en commun à faire, des projets voient le jour, de plateformes de vidéo qui restent à nourrir, et il y aurait la possibilité d’introduire les langues régionales de manière pertinente, les langues en ligne, nous avons des séquences nombreuses, mais sur les langues régionales cela reste encore à développer et à bâtir. C’est le cas aussi de sites gratuits très consultés, plus d’un million de clics par an, sur lesquels la place des langues régionales reste à faire. C’est vous dire que le CNDP est partie prenante de cela et on continue d’accompagner les langues des outre-mer mais c’est à l’état embryonnaire et je crois que cela peut être un effet de ces états généraux, se dire qu’il est grand temps qu’on travaille plus grandement ensemble.


Vos réactions sur cette table ronde


Vos compléments d'informations et commentaires