Le directeur de Microsoft AI : « Le contenu public est libre d’utilisation pour l’IA »

Mustafa Suleyman
Pieterjan Van Leemputten

Mustafa Suleyman, CEO de Microsoft AI, estime que le contenu librement accessible en ligne peut être utilisé pour entraîner une IA.

Mustafa Suleyman a fait cette déclaration à CNBC lors du Festival « Ideas » d’Aspen, où on lui a demandé si les entreprises d’IA violaient la propriété intellectuelle en utilisant des données puisées sur le web pour entraîner leurs grands modèles de langage (LLM) sans demander l’autorisation de ceux qui les ont créées, ni leur verser la moindre indemnité.

« Pour ce qui est du contenu qui se trouvent sur l’Internet ouvert, le contrat social en vigueur depuis les années 90 prévoit qu’il est soumis au principe de l’utilisation équitable (fair use) », explique Mustafa Suleyman. « N’importe qui peut le copier, le recréer ou le reproduire. On peut le considérer comme du freeware. C’est en tout cas notre interprétation. »

En même temps, il reconnaît que les choses se compliquent que si des entreprises ou organismes de presse déclarent que leur contenu ne peut pas être collecté ou copié. « On se trouve alors dans une zone grise sur laquelle les tribunaux seront amenés à trancher. »

Que les choses soient claires : les déclarations de Mustafa Suleyman sont avant tout opportunistes. Elles rappellent celles de Mark Zuckerberg, le fondateur de Facebook, qui a affirmé un jour que la protection de la vie privée était un concept en voie d’extinction. De la même manière, Mustafa Suleyman tente de faire oublier que le modèle économique de nombreuses applications d’IA repose sur des données utilisées sans autorisation.

Et si de nombreux sites sont dénués de mentions légales détaillées, eux aussi sont couverts par les droits d’auteur et leurs textes ne peuvent donc pas non plus être copiés sans autorisation.

Il faut également distinguer une utilisation commerciale d’une utilisation non commerciale. Pensez par exemple à un enseignant qui trouve les articles de Datanews.be si passionnants qu’il les diffuse dans sa classe. Lui ne risque aucun procès. Mais si vous copiez des articles pour les placer ensuite sur votre propre site web – après les avoir réécrits ou non –, il se peut que le service juridique de Roularta vous demande, sur un ton amical mais ferme, de mettre un terme à cette pratique.

Mustafa Suleyman semble également établir une distinction entre ceux qui sont en mesure d’intenter un procès et ceux qui n’en ont pas les moyens. Ces derniers mois, OpenAI, dont Microsoft est l’investisseur principal, a conclu plusieurs accords avec des éditeurs comme le New York Times et Axel Springer (éditeur notamment de Politico, Bild et Business Insider). L’entreprise reconnaît donc implicitement que les plateformes dont le contenu peut être lu gratuitement devraient être rémunérées. Mais elle n’a apparemment pas l’intention de payer pour le contenu de tout le monde sur Internet.

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire