OpenAI introduit un modèle d’IA capable de tourner sur un ordinateur portable

Sam Altman, CEO d’OpenAI © Tom Williams/CQ-Roll Call/Sipa USA
Els Bellens

OpenAI, la société-mère de ChatGPT, a lancé deux nouveaux modèles linguistiques d’IA. Ces deux modèles peuvent tourner localement sur un ordinateur et ne nécessitent donc pas de connexion cloud.

OpenAI sort deux versions de son modèle linguistique d’IA: la première à 120 milliards de paramètres (gpt-oss-120b) et l’autre, plus petite, à 20 milliards de paramètres (gpt-oss-20b). Un paramètre est une variable qu’un modèle d’IA utilise pour apprendre et faire des prévisions: plus il comporte de paramètres, plus le modèle est intelligent, mais aussi plus lourd. Les modèles volumineux intègrent beaucoup plus de paramètres, mais doivent tourner sur une infrastructure serveur robuste. ChatGPT4, par exemple, compte environ 1,8 billiard de paramètres et tourne par conséquent dans le cloud.

Ces modèles sont toutefois suffisamment compacts pour tourner sur un ordinateur. Cependant, le modèle à 120 milliards de paramètres nécessite 80 Go de mémoire environ ou une carte graphique NVIDIA moderne. Le modèle plus petit peut, lui, tourner sur un ordinateur portable classique à seulement 16 Go de RAM, mais il est moins puissant.

Modèle ouvert

Il s’agit du premier modèle ‘open weight’ d’OpenAI depuis six ans. Ces modèles sont personnalisables. Les amateurs pourront en effet modifier les commandes internes pour adapter chaque modèle à leurs besoins. Cela ne signifie cependant pas que l’entreprise en publiera le code source et les données de formation.

Les modèles ouverts présentent l’avantage de pouvoir être maintenus hors ligne, ce qui se traduit par une latence moindre et des temps de réponse plus rapides. Pour certaines entreprises qui préfèrent éviter la divulgation d’informations sensibles en ligne, ils peuvent également offrir une solution permettant d’utiliser des implémentations d’IA dans un environnement privé.

En revanche, un modèle ouvert est davantage susceptible d’être manipulé et pourrait théoriquement être exploité à des fins illégales. Le lancement des modèles avait de ce fait été reporté en mars. OpenAI insiste sur le fait qu’elle a testé les nouveaux modèles de manière approfondie, et qu’ils ne présenteraient aucun risque significatif.

L’entreprise américaine se sent obligée de sortir ces modèles face à la concurrence croissante de la start-up chinoise DeepSeek. Les modèles d’IA chinois sont en effet presque tous ouverts et, de plus, comparables en termes de performances à ceux d’origine américaine.

 

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire