L’éditeur américain de logiciels Databricks a lancé Dolly 2.0. Il s’agirait du premier modèle linguistique open source à usage commercial, susceptible de constituer la base de concurrents gratuits ou open source de chatbots tels que ChatGPT.

Dolly 2.0 est un générateur de texte, un ‘large language model’ (llm) capable de piloter des chatbots et de résumer des textes ou d’exécuter des instructions de recherche. Au niveau des fonctions, Dolly 2.0 ressemble donc fortement à d’autres llm sortis ou annoncés ces derniers mois, dont ChatGPT est probablement le plus connu. Ce qui est spécial dans ce cas cependant, c’est que Dolly 2.0 est open source et que les développeurs indépendants et les entreprises peuvent souscrire une licence gratuite au service, afin de l’incorporer à des produits commerciaux.

L’IA est une suite du premier Dolly, qui était sorti en mars de cette année. L’entreprise à l’initiative du llm s’appelle Databricks, un éditeur de logiciels professionnels, spécialisé dans Apache Sparks. ‘Nous voulons lancer sur le marché davantage de modèles linguistiques ouverts et transparents, parce que nous souhaitons que les entreprises puissent avec l’IA créer, former et posséder leurs propres chatbots et applis’, déclare Ali Ghodsi, CEO de Databricks, au site technologique TechCrunch.

Aucune restriction

Ce qui est étonnant, c’est que Dolly 2.0 est donc le premier modèle d’IA générative à être lancé sans aucune restriction sur le marché. Les entreprises qui veulent travailler avec ChatGPT par exemple, paient pour l’API et doivent aussi souvent partager des données. Avec un modèle open source, le système devrait s’avérer utilisable par davantage d’entreprises.

Ceci dit, Dolly 2.0 semble avoir non seulement des avantages similaires, mais aussi des inconvénients caractéristiques d’autres llm. C’est ainsi que l’algorithme parlerait surtout anglais et aurait tendance à imaginer des faits. Il se montrerait parfois aussi offensant au niveau de ses expressions. Tous ces problèmes avaient déjà été relevés chez d’autres modèles linguistiques.

Le développement de l’IA générative s’est littéralement emballé ces derniers mois, puisque plusieurs géants technologiques tentent de se positionner sur ce marché. Les modèles linguistiques font cependant aussi l’objet de critiques. C’est ainsi que des questions se posent à propos des sources à partir desquelles ces modèles sont formés, et/ou à propos de savoir si les auteurs de ces sources ont donné leur consentement pour leur utilisation. Des experts internationaux ont en outre lancé une pétition par laquelle ils demandent que le développement de l’IA soit suspendu pendant un certain temps. Ils se font notamment du souci au sujet des effets économiques de la technologie, ainsi que des dangers d’une désinformation à grande échelle, au cas où ces chatbots inonderaient notre internet.