Une Wikipedia écossaise rédigée par quelqu’un qui ne connaît pas la langue

Els Bellens

Des dizaines de milliers d’articles incorrectement écrits peuvent exercer un impact sur la réputation de la langue et sur les AI utilisant ces pages pour l’apprendre.

Quasiment la moitié de la version écossaise de Wikipedia semble avoir été rédigée par un Américain qui ne connaît même pas cette langue. L’écossais, l’une des langues officielles de l’Ecosse, est une combinaison de gaélique et d’un dialecte de Germanie occidentale ayant sa propre terminologie et sa propre grammaire. L’utilisateur AmaryllisGardener l’a cependant interprété comme de ‘l’anglais avec un drôle d’accent’ et a rédigé plus de 23.000 articles dans ce charabia pour la version écossaise de Wikipedia.

L’utilisateur en question a fourni des contributions à sco.wikipedia.org et fut aussi administrateur de pages avec 200.000 modifications à la clé. Pendant six ans, cette personne a écrit des articles dans ce drôle de langage à l’accent écossais tel qu’on l’entend souvent dans des films, mais dans le texte, la lettre ‘y’ par exemple a été remplacée par ‘ee’.

Ce cas fut mis en évidence par un thread sur Reddit. Les pages font quelque peu penser à des wikis consacrés à l’un ou l’autre patois local sur le ton de la plaisanterie, à cette différence près que dans le cas présent, l’écossais est une langue à part, mais bien réelle avec, surtout en Grande-Bretagne, une connotation quelque peu nationaliste. Une consultation populaire réalisée en 2011 indique du reste qu’un tiers environ des Ecossais utilise encore la langue ou à tout le moins la comprennent.

La piètre qualité de ces pages Wikipedia nuit en tout cas à l’image de la langue. Des millions de gens utilisent en effet l’encyclopédie Wikipedia et s’ils consultent ces pages, ils en déduisent que l’écossais est une sorte de variante décrépite de l’anglais. Cela alimente aussi l’argument, selon lequel l’écossais ne mérite pas d’être considéré comme une langue à part. Le Redditor qui a été le premier à découvrir le cas en question, parle de vandalisme culturel.

Tout cela empire encore lorsqu’on automatise. Une série d’algorithmes linguistiques utilisent Wikipedia, dont la version écossaise, comme référence à des fins d’identification et de traduction. ‘L’écossais’ d’un Américain qui recourt à un drôle d’accent pour rédiger des dizaines de milliers d’articles, est alors assimilé au véritable écossais sur internet.

A présent que ces erreurs ont été découvertes, une action de nettoyage a été prévue sur ces pages par – on l’espère! – des personnes qui connaissent vraiment la langue. Quoi qu’il en soit, ils vont avoir pas mal de travail pour améliorer tous ces articles datant de 2013.

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire