Wikipédia conclut des accords avec les ‘Big Tech’ pour la formation de l’IA avec son contenu

Jimmy Wales, co-founder de Wikipedia. © dpa/picture alliance via Getty I
Sebastien Marien Stagiair Data News 

Hier jeudi, Wikipédia a annoncé des partenariats avec plusieurs grandes firmes technologiques, dont Microsoft, Meta et Amazon. L’organisation sans but lucratif effectue ainsi un important pas en vue de bénéficier de la forte dépendance des firmes technologiques à son contenu.

La Wikimedia Foundation, qui gère l’encyclopédie en ligne, a fait savoir qu’elle avait l’année dernière aussi conclu des accords avec des start-ups d’IA telles Perplexity et la française Mistral AI. Meta et Amazon y avaient précédemment déjà été accueillies en tant que partenaires. En outre, il existait depuis 2022 déjà une collaboration avec Google. Wikimédia a fait ces annonces de partenariats conclus avec des firmes ‘Big Tech’ à l’occasion du 25ème anniversaire de Wikipédia.

Le contenu de Wikipédia joue un rôle crucial dans la formations des modèles d’IA. L’encyclopédie regroupe quelque 65 millions d’articles dans plus de 300 langues. Le contenu de Wikipédia a vu le jour grâce à quelque 250.000 rédacteurs bénévoles au niveau mondial qui écrivent, éditent et contrôlent les articles. La plateforme constitue de ce fait un élément important des données de formation pour les chatbots d’IA générative des grandes firmes technologiques.

Cette utilisation massive présente toutefois un inconvénient. Les entreprises qui extraient de grandes quantités d’informations Wikipedia librement accessibles pour la formation de l’IA, entraînent une sollicitation en forte hausse des serveurs et des coûts plus élevés. Tout cela pèse lourd sur la Wikimedia Foundation, qui repose principalement sur de petits dons du public.

Service Enterprise

Pour réduire cette pression, Wikimedia se concentre davantage sur son service Enterprise. Ce dernier offre aux firmes technologiques un accès payant au contenu Wikipédia à des fins de formation dans des formats structurés réutilisables.

‘L’accès à une information de haute qualité et fiable est au cœur de notre vision de l’avenir de l’IA chez Microsoft’, déclare Tim Frank, corporate vice president de Microsoft, dans un communiqué de presse de Wikimedia. ‘Conjointement avec Wikimedia, nous contribuons à créer un écosystème de contenus durable pour l’internet IA, dans lequel les contributions des créateurs sont valorisées.’

Des nouvelles rentrées, comme les accords technologiques qui viennent d’être annoncés, aident également Wikimedia à investir dans de nouvelles infrastructures, telles son réseau de centres de données à travers le monde. L’organisation dispose de sept centres de données aux Etats-Unis, à Singapour, aux Pays-Bas, en France et au Brésil. Ce dernier est le plus récent, puisqu’il a ouvert ses portes il y a deux ans. Les

investissements dans les centres de données contribuent à réduire les durées de chargement de Wikipédia dans le monde entier.

Lire plus de:

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Expertise Partenaire