Les langues humaines ont beaucoup évolué au fil des millénaires. Pour éviter les ambiguïtés et garantir la précision, certaines personnes ont même créé de nouvelles langues ces dernières décennies. Certaines de ces langues ont été conçues pour des usages spécifiques et de courte durée. Les plus récentes, appelées langages de programmation, visent à faciliter la communication entre les humains et les machines. Pourtant, toutes ces langues sont confrontées à un défi majeur : le risque d’extinction.
L’année 2019 a été proclamée Année internationale des langues autochtones (IYIL)1. De nombreuses langues à travers le monde sont menacées de disparition. Des efforts sont probablement en cours pour éviter qu’elles ne sombrent dans l’oubli. Grâce aux diverses campagnes menées durant cette année de sensibilisation, de nombreux articles ont été publiés sur les langues autochtones. Un peu partout dans le monde, les gens ont pris conscience de la diversité linguistique, du degré de menace qui pèse sur ces langues8 et du risque de leur disparition. Certains chercheurs avancent même que la protection de la diversité linguistique pourrait jouer un rôle important dans la préservation de la biodiversité mondiale9.
L’UNESCO a classé2 plusieurs milliers de langues menacées selon cinq catégories : vulnérables, en danger, sérieusement en danger, en danger critique et éteintes. Environ 2 500 langues ont été recensées dans ce cadre, en prenant en compte des facteurs tels que le nombre de locuteurs, les contextes d’usage de la langue, la transmission intergénérationnelle des connaissances linguistiques, la fréquence d’utilisation, etc. Malheureusement, les langues éteintes sont celles pour lesquelles il ne reste plus aucun locuteur.
Certaines langues mentionnées ci-dessus ont mis des siècles à se structurer. Historiens et linguistes ont collaboré régulièrement pour codifier leur écriture et leur grammaire. Mais les langues humaines posent de nombreux problèmes. Les phrases ambiguës, les métaphores, les évolutions de sens rendent difficile la compréhension fidèle des textes anciens. Pour pallier ces limites, des langues construites3 ont vu le jour. Conçues pour permettre une communication claire et formelle au sein d’un groupe, elles visent souvent à définir des concepts avec précision. Certaines ont même été créées pour des univers de fiction, notamment dans les films, afin de permettre la communication entre personnages imaginaires.
À côté de cela, il existe les langages de programmation, conçus pour permettre la communication entre les humains et les machines. Plusieurs ont été inventés depuis les années 1950. Beaucoup s’inspirent de certaines langues humaines comme l’anglais. Toutefois, leur syntaxe et leur sémantique sont soigneusement définies par leurs concepteurs. Même si certains essaient de développer des langages de programmation plus proches des langues naturelles, la recherche en est encore loin. Les machines ne comprennent ni les langages naturels ni les langages de programmation : elles ont besoin de traducteurs, ou programmes capables de transformer ces langages en langage machine. Ces programmes, appelés compilateurs4 ou interprètes, doivent impérativement éviter toute ambiguïté.
De nombreux efforts sont entrepris pour documenter et préserver les langues humaines. Mais les langages construits et les langages de programmation restent souvent en marge de ces initiatives. Les langages de programmation, en particulier, évoluent très rapidement. Certains, pourtant populaires il y a quelques décennies, ont presque complètement disparu. Il devient parfois très difficile de trouver des développeurs capables de maintenir les anciens systèmes conçus dans ces langages5.
L’évolution linguistique ne s’arrête jamais. Le langage dominant utilisé dans la recherche scientifique a déjà changé plusieurs fois au cours des siècles. Grâce aux efforts de sauvegarde et au nombre encore significatif de locuteurs, nous avons encore accès à certains anciens textes scientifiques, que l’on peut traduire et comprendre. Cependant, de nombreuses gravures rupestres ou manuscrits anciens restent indéchiffrables pour la communauté scientifique. Les informations relatives à leurs systèmes d’écriture ont été perdues. De même, les systèmes informatiques développés avec des langages de programmation aujourd’hui obsolètes risquent d’être tout aussi incompréhensibles sans documentation décrivant leur syntaxe et leur sémantique.
La documentation des langues humaines, des langues construites et des langages de programmation représente un véritable défi. Pour les langues humaines, la sauvegarde passe par la description des systèmes d’écriture et de la grammaire, l’archivage de livres importants, l’enregistrement d’entretiens avec des locuteurs natifs, etc. On pourrait penser que les langages de programmation sont souvent ignorés dans ces discussions. Pourtant, le patrimoine numérique6 a permis de les remettre au centre des préoccupations. Des initiatives telles que Software Heritage7 visent justement à documenter et archiver le code source issu de nombreux dépôts publics.
De nombreux aspects de notre vie sont désormais numérisés. Les interactions humaines, tout comme celles entre humains et machines, impliquent aujourd’hui des dimensions numériques. Il serait donc pertinent d’envisager la préservation linguistique selon ces trois catégories de langues, en fonction de leur accessibilité dans le monde numérique.
Références
- International Year of Indigenous Languages
- UNESCO Atlas of the World’s Languages in Danger
- Constructed language
- Compiler
- The future of COBOL is now
- Digital heritage
- Software heritage
- How many languages are endangered?
- Frainer, André, et al. “Opinion: Cultural and Linguistic Diversities Are Underappreciated Pillars of Biodiversity.” Proceedings of the National Academy of Sciences, vol. 117, no. 43, Oct. 2020, pp. 26539–43. www.pnas.org, doi:10.1073/pnas.2019469117.