Déterminer quelles phrases dans des articles publiés sur Wikipedia doivent être étoffées d'un renvoi vers une publication scientifique: ce n'est pas une tâche ordinaire. Même pour des expressions aussi évidentes que 'le ciel est bleu', il est besoin de mentionner une source, fait observer l'encyclopédie en ligne.

Ce genre de référence manque dans de nombreux articles - dans un quart des articles en langue anglaise, il n'y en a même aucune. L'intelligence artificielle devra désormais montrer aux membres de Wikipedia à quelles expressions non encore étayées ils doivent accorder la priorité.

"Suite à une étude approfondie effectuée par des rédacteurs anglais, italiens et français, nous avons dressé une liste de règles, afin de spécifier quelles phrases nécessitent une citation. Nous avons utilisé les résultats de l'étude pour former un modèle d'apprentissage machine, qui soit capable de prévoir si une phrase spécifique doit être étayée ou non par une référence", explique la Wikimedia Foundation sur un blog.

Cet algorithme est à présent et pour nonante pour cent des phrases à même d'indiquer correctement si un renvoi vers des études scientifiques s'avère nécessaire ou non. L'algorithme a aussi été entraîné à signaler pourquoi c'est nécessaire, en lui soumettant huit raisons. Dans 62 pour cent des cas, la raison correcte a été choisie.

La technologie ne peut provisoirement être utilisée que pour les pages Wikipedia en langue anglaise, mais elle devrait être aussi disponible pour d'autres langues dans les trois mois à venir.

La Wikimedia Foundation, l'a.s.b.l. de coordination qui milite pour la diffusion de la connaissance, a libéré son gisement de données et son rapport de recherche et mettra bientôt aussi son logiciel à la disposition de tout un chacun.

© Randall Munroe