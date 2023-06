Microsoft et OpenAI pourraient bientôt faire l’objet d’un recours collectif pour avoir collecté des données sans autorisation. Si elle est acceptée, l’affaire pourrait coûter des milliards aux entreprises.

La plainte a été déposée par 16 seize individus anonymes contre Microsoft et à OpenAI, la société derrière ChatGPT, pour collecte d’informations personnelles sans autorisation. Dans cette affaire, portée devant le tribunal de San Francisco, ils affirment que les entreprises ont ignoré les moyens légaux pour collecter des données afin d’entraîner leur modèle d’IA et qu’elles ont au contraire collecté ces données sans les payer.

Dans leur plainte, ils rapportent qu’il existe des protocoles permettant d’acheter légalement des informations personnelles et d’autres contenus, mais que Microsoft et OpenAI ont choisi d’adopter une autre approche : le vol. « Les entreprises ont extrait systématiquement et sans autorisation 300 milliards de mots sur Internet, dans des livres, des articles, des sites web et des publications, y compris des informations personnelles. OpenAI l’a fait en secret, et sans s’enregistrer comme courtier en données comme l’exige la loi applicable », peut-on lire dans la plainte.

Recours collectif

La plainte maintient ensuite que ces informations sont désormais intégrées dans les produits d’intelligence artificielle de l’entreprise et qu’elles pourraient donc être divulguées, mettant en péril la vie privée de millions de personnes. La plainte vise le statut de recours collectif, auquel plusieurs personnes peuvent souscrire, avec des dommages-intérêts potentiels pouvant s’élever à 3 milliards de dollars. Microsoft et OpenAI n’ont pas encore répondu aux accusations.

OpenAI a lancé son IA générative, ChatGPT, à la fin de l’année dernière. Si le chatbot a largement mis en lumière l’IA générative, il a également fait l’objet de controverses dès le départ, car on ne sait pas exactement sur la base de quelles informations l’algorithme a été entraîné, ni dans quelle mesure ces informations sont protégées par des droits d’auteur, par exemple, ou peuvent être considérées comme des données personnelles.