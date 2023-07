Les écrivains américains Mona Awad et Paul Tremblay ont intenté un procès à OpenAI à San Francisco. Ils affirment que l’entreprise a utilisé leur travail pour former GPT-3, le modèle linguistique sous-jacent au chatbot ChatGPT.

Comme ChatGPT est capable de générer à la demande des résumés de leurs livres, il est tout à fait logique que le modèle linguistique a été formé sur cette base: tel est l’un des principaux arguments utilisés par la romancière canadienne Mona Awad et l’auteur américain de science-fiction, de fantasy et d’horreur Paul Tremblay pour intenter un procès à OpenAI auprès d’un tribunal fédéral américain à San Francisco. Ils accusent l’entreprise à l’initiative de ChatGPT d’avoir utilisé leurs œuvres ‘sans autorisation, sans mention de sources et sans rétribution’ pour rendre plus intelligent le modèle linguistique GPT-3.

L’acte d’accusation formel indique même qu’OpenAI a probablement utilisé des livres électroniques obtenus illégalement des deux auteurs, en provenance de ce qu’on appelle des sites web ‘shadow library’ (bibliothèques fantômes) tels que Library Genesis et Sci-Hub, où des œuvres protégées par des droits d’auteur sont publiées clandestinement. ‘Ces bibliothèques fantômes manifestement illégales s’avèrent intéressantes depuis longtemps déjà pour la communauté de la formation IA’, peut-on lire dans l’acte d’accusation.

Les deux écrivains souhaitent que leur procès reçoive le statut de recours collectif (‘class action’), afin que d’autres auteurs puissent s’y rallier. Ce ne sont pas là les seuls problèmes juridiques auxquels sont confrontées des entreprises IA ces derniers mois. C’est ainsi qu’en février, le service photos Getty Images a également intenté un procès à Stable Diffusion, la firme à l’initiative du générateur d’images IA Midjourney, pour avoir récupéré 12 millions d’images de la base de données de Getty dans le cadre de la formation de ce modèle.