L’IA a clairement atteint la maturité. Pour preuve, les magazines et quotidiens ont tous abordé ces derniers mois la question de ChatGPT. Mais comment les sociétés d’IA réagissent-elles face à l’intérêt soudain pour cette technologie auprès du grand public?

“Nous considérons l’IA tout d’abord comme la technologie susceptible de révolutionner la productivité”, estime d’emblée Nicolas Deruytter, CEO de ML6. L’entreprise a été fondée en 2013 à Gand en se spécialisant dans le développement de solutions d’IA. Entre-temps, le groupe emploie 120 collaborateurs et dispose également de bureaux à Amsterdam, Berlin et Zürich. “Ce gain de productivité prendra des formes très différentes. C’est ainsi qu’il est déjà perceptible dans des applications basées sur le ‘text to…’ Celui qui ne sait pas dessiner peut, grâce à l’IA associée à du texte, demander à la machine de faire un dessin. Grâce à Stable Diffusion, tout le monde peut maintenant expérimenter la solution en ligne.

Ouvert et assez accessible

“Jusqu’ici, l’IA se traduisait surtout par des solutions ponctuelles, ajoute Nicolas Deruytter. Par exemple pour le traitement automatique de documents dans une banque.” Mais désormais, le secteur constate une accélération marquée dans le type d’adoption de l’IA. “Cela dit, je suis surtout enthousiasmé par le côté transformationnel de l’IA. La plupart des évolutions que l’on constate aujourd’hui sont très ouvertes et assez accessibles. C’est ainsi que ChatGPT a été construit en code source ouvert. Cela signifie que nous pouvons avec ML6 aider des entreprises à adapter leurs jeux de données pour ChatGPT.”

Stable Diffusion permet de générer une image réaliste de Poutine à cheval sur une plage.

Ces développements ouvrent la voie à des applications plus spécifiques, sur mesure pour les entreprises. “Permettez-moi de préciser les choses, ajoute Nicolas Deruytter. Avec Stable Diffusion, il est possible de générer une image de Poutine à cheval, mais vous n’avez pas encore un dessin prêt à l’emploi à imprimer sur un T-shirt. En d’autres termes, il faut encore adapter le composant IA et l’intégrer dans un processus d’entreprise.”

Ce qui est petit…

L’une des tendances majeures est que ces modèles d’IA générative sont très rapidement devenus très petits. “Le modèle entraîné de Stable Diffusion a été réduit en 6 mois de temps de 200 Go à quelques Mo, ce qui permet désormais de l’utiliser sur un smartphone”, note encore Deruytter. L’un des avantages potentiels de cette évolution est de réduire le risque de voir un nouveau Google émerger en matière d’IA, soit une entreprise capable de dominer et de contrôler l’ensemble d’un secteur. “Il est intéressant de commencer petit, estime Deruytter, avec un modèle qui est affiné en fonction d’une entreprise, d’un secteur, d’un pays.”

Dans ce contexte, un nouveau rôle émerge, celui d’entreprise de fourniture de données dont la mission est de veiller aux données qui servent à alimenter le modèle de telle entreprise, tel secteur ou tel pays. “La pire chose à faire aujourd’hui pour une entreprise est de négliger un phénomène comme ChatGPT, prétend Nicolas Deruytter. Qu’on le veuille ou non, l’IA s’imposera. La seule question est de savoir comment aborder cette technologie en tant qu’entreprise.”

Valeur aujourd’hui et demain

“Le nombre de paramètres et la capacité d’absorption pour stocker des connaissances et des relations est en augmentation, prétend Laurent Sorber, CTO de Radix, une entreprise belge qui développe des solutions d’IA notamment pour le pharma, le transport, les médias et les RH. Du coup, les applications à base de GPT intégreront à l’avenir davantage de connaissances et commettront moins d’erreurs dans leur utilisation.”

GPT est l’acronyme de Generative Pre-trained Transformer, ChatGPT étant actuellement l’exemple le plus connu de solution s’appuyant sur un GPT. Selon Laurent Sorber, la dimension RLHF se révèle également importante dans le cadre de la technologie GPT, à savoir le Reinforcement Learning from Human Feedback. “Celle-ci permet la sélection de réponses informatives au départ de l’ensemble des réponses statistiquement possibles.”

OpenAI, l’entreprise à l’origine de ChatGPT, entend faire évoluer à terme sa solution vers AGI ou Artificial General Intelligence. “La valeur potentielle de cette approche sera encore supérieure, estime Laurent Sorber. Car à partir de ce moment-là, on parlera de capacité à comprendre ou à apprendre n’importe quelle tâche intellectuelle exécutée par un humain.” Sam Altman, CEO d’OpenIA affirme d’ailleurs qu’AGI pourrait absorber le “cône lumineux de toute valeur future.”

Quoi qu’il en soit, le capital investi par Microsoft dans OpenAI ne fera qu’accélérer l’évolution. A noter que Microsoft fait une différence entre la valeur actuelle de ChatGPT et son potentiel dans un futur plus lointain. “Il est prévu que Microsoft intègre ChatGPT dans Office, par exemple pour créer des transparents ou pour concevoir un document Word.” Ce qui nous ramène aux propos de Nicolas Deruytter de ML6: il s’agit de gains de productivité.

Quid de nos données?

Voilà qui soulève en tout cas des questions sur les données personnelles des utilisateurs et sur qui les possédera. Laurent Sorber se veut nuancé. “En Europe, la protection des données personnelles que nous générons est très forte. Même Microsoft doit satisfaire au RGPD lorsqu’elle utilise nos données.” Reste à savoir quel sera l’accord conclu entre Microsoft et OpenAI. “A l’origine, OpenAI partait du principe qu’il fallait éviter qu’AGI tombe un jour entre les mains d’une seule et même entité. Cela étant, nous ne savons évidemment pas si OpenAI continuera à adapter la même philosophie à l’avenir.”

Laurent Sorber s’attend à court terme à voir les manquements actuels évidents de ChatGPT être corrigés, comme la mention de la source qui permet de contrôler les réponses données et l’interaction avec les photos et l’audio que l’on intègre. “Nous nous verrons également les premiers pas timides vers l’AGI, comme la possibilité de raisonner et d’expliquer progressivement des réponses.”

L’AI est transversale

Toutes les applications d’IA ne sont pas autant médiatisées que ChatGPT, même si elles sont souvent tout aussi spectaculaires. Un bel exemple à cet égard est Nuclia, une start-up de Barcelone qui a totalement repensé la fonction de recherche classique en ajoutant l’AI à l’ensemble. “Autrefois, nous développions des applications d’intranet pour les entreprises, explique son CEO, Eudald Camprubi. Or les clients se plaignaient souvent qu’il était difficile de retrouver certaines informations sur un tel intranet.” Tel fut le constat à la base de l’actuelle Nuclia.

Stable Diffusion: un robot peint sur un chevalet un tableau dans le style Cézanne.

Quelque 80% de l’ensemble des données d’une entreprise sont non structurées. “Tout indexer? C’est très difficile, explique Eudald Camprubi, ne serait-ce que parce que ces données ne sont pas classées partout de manière rigoureuse: elles sont dans SharePoint, sur AWS, dans des formats et de langues divers et variés. Avec une requête de recherche classique et un moteur de recherche, on ne va pas très loin.” Nuclia a dès lors imaginé une approche originale sous la forme d’une méthode d’indexation rapide de données non structurées, combinée à une fonction de recherche, le tout supporté par l’IA qui s’appuie sur des modèles linguistiques. Le résultat concret est une API en low-code. “Sans devoir écrire de code, il est possible d’ajouter une fenêtre de recherche Nuclia à n’importe quelle application.” Certes, Nuclia doit au préalable indexer les données sur lesquels on veut effectuer des recherches, à savoir non seulement les documents Word et les PDF, mais aussi les photos, l’audio, la vidéo, etc. Par la suite, tout le travail de Nuclia se fait dans Google Cloud.

Vers le passage adéquat

Un exemple permet de mieux comprendre le processus. Fin octobre a eu lieu à Namur une conférence destinée aux utilisateurs de la solution de CMS Plone. Toutes les présentations de la conférence sont accessibles sur YouTube. Mais comment y retrouver ce que l’on recherche? “L’organisateur a transmis les URL des vidéos à Nuclia”, explique Camprubi. En coulisse, Nuclia a déployé le ‘speech-to-text’ qui a permis ensuite à la solution d’indexer automatiquement les contenus. “Celui qui cherche de l’information sur un sujet particulier tape simplement un mode de recherche dans la fenêtre de recherche sur le site de la conférence.”

Nuclia affiche alors comme résultat non seulement une ou plusieurs vidéos, mais aussi le passage exact de la vidéo dans laquelle le terme demandé se présente. Détail amusant: Nuclia supporte désormais 101 langues. “La langue n’est pas une barrière, insiste Eudald Camprubi. Une requête de recherche dans un langue particulière peut afficher des résultats de documents, vidéos ou autres dans d’autres langues. Nuclia estime que son produit pourrait être utilisé notamment dans des hôpitaux, des administrations publiques, des universités et des services à la clientèle. Et dans ces cas également, l’objectif visé est clair: des gains de productivité.