La nouvelle version de Dall-E est surtout améliorée par ChatGPT

Ronald Meeus

22-09-2023, 11:39 Mise à jour le: 22-09-2023, 11:39 Source: Data News 2 min. de lecture

La troisième version du générateur d’images IA Dall-E est non seulement quelque peu améliorée au niveau de ce qu’elle génère, mais les invites pourront être également beaucoup plus complexes. Le développeur OpenAI n’a pas dû chercher bien loin pour ce faire, puisque Dall-E 3 est désormais alimenté par son propre ChatGPT.

Avec la percée publique de l’IA générative, notre vocabulaire technique s’étoffe également rapidement. L’ingénierie des invites (prompt engineering) par exemple est un terme que nous apprenons tous progressivement à connaître: l’élaboration d’une invite sophistiquée, à savoir l’instruction que l’utilisateur transfère à l’IA, devient progressivement presqu’un métier en soi. Et l’équipe à l’initiative de Dall-E chez OpenAI, la toute nouvelle célébrité de la Silicon Valley, semble également en avoir pris conscience.

La version 3 du générateur d’images IA, améliorée par ChatGPT, pourra ainsi traiter des questions beaucoup plus détaillées et complexes, mais désormais également créer en permanence de nouvelles versions basées sur l’interface conversationnelle de ChatGPT. C’est comme si l’utilisateur demandait à un dessinateur d’apporter des modifications au cours du processus. ‘Vous n’aurez pas vraiment à vous soucier de la pagaille des très longues invites’, a déclaré à Wired Aditya Ramesh, en charge de l’équipe Dall-E. ‘En lieu et place, vous pourrez simplement communiquer avec ChatGPT comme si vous parliez à un collègue.’

Meilleurs résultats

La troisième version de Dall-E – le nom, pour ceux qui ne le sauraient pas encore, d’un portemanteau de l’artiste Salvador Dalí et du personnage de Pixar Wall-E – contient également une série d’ajustements à l’algorithme. Celui-ci recherche toujours de grandes quantités d’images sur internet et, sur cette base, prédit comment une image contenant certains éléments déterminés doit être ‘rendue’. Il excelle par exemple désormais un peu plus dans les proportions entre les objets et s’avère quelque peu plus net dans les détails tels que les mains et les reflets.

De plus, des filtres plus stricts ont été placés sur le contenu susceptible d’être créé par le générateur d’images. Il sera désormais plus malaisé de générer des images violentes, haineuses ou – euh – érotiques. OpenAI a également consacré un ‘red team’ à l’algorithme pour garantir que le générateur d’images ne sur- ou sous-représente pas des groupes de population dans l’illustration.

Mesures de protection

Autres améliorations: les invites ne peuvent pas concerner des personnalités publiques. Et ce, pour contrer les risques de propagande et de désinformation avec le générateur d’images de plus en plus puissant. Le nombre de mesures permettant aux artistes de protéger leur œuvre originale a en outre été élargi. Dall-E 3 rejette les invites en vue de créer des illustrations dans le style d’artistes encore en vie. Les artistes peuvent également indiquer qu’ils ne souhaitent pas que l’algorithme soit formé à partir de leur travail.

Dall-E 3 sera disponible au grand public au cours du quatrième trimestre de cette année.

Lire plus de: