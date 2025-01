Après l’IA étonnamment perfectionnée de DeepSeek, voici à présent qu’Alibaba propose elle aussi un nouveau modèle qui prétend avoir des performances comparables, voire supérieures à celles de ChatGPT 4o et Claude 3.5 Sonnet.

Alibaba présente son nouveau modèle sous l’appellation Qwen2.5-Max. Il a été formé à partir de vingt mille milliards de jetons et peut actuellement être utilisé à la fois comme chatbot (après enregistrement) et dans Alibaba Cloud où peuvent être créées des clés API qui sont également compatibles avec l’API d’OpenAI, selon Alibaba. Un modèle open source n’est pas disponible.

Alibaba a soumis Qwen2.5-Max à plusieurs tests de performances et affirme qu’il surpasse systématiquement DeepSeek-V3, Llama-3.1-405b-Inst, GPT-4o-0806 et Claude-3.5-Sonnet-1022.

Des hallucinations certes, mais pas de censure

Un bref test pratique montre cependant que le chatbot fait encore très souvent preuve d’hallucinations. C’est ainsi que Qwen Chat prétend parler le néerlandais ou le français, si on le souhaite, mais si on lui demande ce qu’il sait de certains membres de notre rédaction, on obtient un texte qui n’a ni queue ni tête. Le rédacteur en chef de Data News travaillerait par exemple à temps partiel comme présentateur de De Mol et de l’émission TV flamande De Slimste Mens Ter Wereld.

Et si on l’interroge plus avant sur certaines célébrités locales, de nombreuses contre-vérités émergent également. Par contre, s’il est question de personnes plus connues au niveau international, ses réponses semblent plus correctes.

Ce qui ne manque pas d’étonner, c’est qu’alors que DeepSeek a rapidement été critiqué cette semaine pour avoir censuré des sujets jugés trop sensibles en Chine, Alibaba réagit différemment. Si on l’interroge par exemple sur la place Tiananmen de Pékin, Alibaba mentionne bien qu’une manifestation étudiante y a été violemment réprimée.

Quelques autres sensibilités chinoises sont par ailleurs simplement communiquées, même accompagnées de la mention que le gouvernement chinois procède à de la censure. On ignore si le chatbot fournit également de telles réponses en Chine. En revanche, les questions sur du contenu à caractère sexuel ou sur la façon de fabriquer une bombe incendiaire sont évitées.