Le marché est inondé de modèles de langage d’IA avec leurs avantages et leurs inconvénients respectifs. Hunch constate encore une lacune sur ce marché : une IA globale qui fait le choix à votre place.
Jeune pousse californienne, Hunch construit ce qui devrait devenir une sorte d’outil d’IA ultime : une IA pour les gouverner toutes, pour la transposer en référence cinématographique. Sa plateforme choisit elle-même le modèle le plus approprié pour une tâche spécifique, agissant comme un réalisateur intelligent dominant le chaos existant de l’IA. Nous rencontrons David Wilson, cofondateur et CEO, lors d’une visite de l’IT Press Tour à San Francisco.
L’IA actuelle ne tient pas ses promesses
L’essor de l’intelligence artificielle a entraîné une nouvelle forme de charge : la « taxe sur le travail inutile », comme David se plaît à l’appeler. Les travailleurs du savoir consacrent une part importante de leur temps à des tâches répétitives et routinières qui pourraient, en principe, être automatisées – bonjour ChatGPT, Gemini, Copilot & consorts ! Mais il parle alors de transformer le contenu d’un système à l’autre sans y ajouter de valeur ou presque. Bien que la technologie existe théoriquement pour automatiser tout cela, les outils d’IA actuels sont encore insuffisants, selon David Wilson, CEO et cofondateur de Hunch.
Pourquoi ne parvenons-nous pas à automatiser notre travail aujourd’hui, alors que tous les outils sont disponibles ? Les plateformes sans code comme Zapier, dit-il, sont souvent lourdes et les flux créés sont fragiles et difficiles à maintenir. De leur côté, les simples « hacks ChatGPT » ne sont pas extensibles et n’apprennent pas, tandis que les agents IA plus avancés ont une courbe d’apprentissage trop raide pour l’utilisateur moyen, quand ils ne sont pas enfermés dans les limites des fournisseurs.
L’IA qui gouverne d’autres IA
Hunch vise à résoudre ces problèmes par une double approche. D’une part, il y a la plateforme Hunch elle-même, une trame visuelle pour les « utilisateurs chevronnés » qui souhaitent relier différents modèles d’IA provenant de divers fournisseurs tels que OpenAI, Anthropic, Gemini, Groq, Mistral et ElevenLabs pour des tâches complexes. D’autre part, il y a le nouveau rejeton, Overclock – bien qu’il soit encore en phase de test – qui se concentre sur l’automatisation des tâches récurrentes par le biais de commandes simples en anglais. « Describe once. Done forever », telle est sa devise… qui fait mouche.

Au lieu d’obliger l’utilisateur à faire un choix, la plateforme sélectionne elle-même l’outil le plus approprié pour le travail à effectuer. Mais alors, n’y a-t-il pas des points de repère, des références et de nombreux tests comparatifs à ce sujet ? David Wilson semble particulièrement critique à l’égard des méthodes actuelles de comparaison des modèles. « Je pense que quasiment tous les critères de référence du LLM sont pratiquement dénués de sens », déclare-t-il sans détour. Selon lui, ces critères sont trop optimisés pour une expérience de chat fluide et ne disent pas grand-chose sur les capacités réelles d’un modèle à accomplir effectivement une tâche, avec la qualité requise et une exécution conforme aux souhaits.
« Les modèles d’IA vont s’éloigner les uns des autres, je ne vois pas comment le nombre de modèles pourrait diminuer »
David pense que, dans un avenir proche, les LLM, ou modèles d’IA, seront de plus en plus différents les uns des autres, et non que leur nombre s’amenuisera. « La seule façon de savoir quel modèle est le plus performant est de l’utiliser. Mais qui a le temps de le faire pour chaque tâche, manuellement, et de comparer tous les résultats à chaque fois », pose-t-il comme une question rhétorique.
La plateforme Hunch facilite cette tâche en fournissant une méta-couche. Pour Overclock, cela se traduit par une approche pragmatique. « Overclock peut utiliser certains des meilleurs modèles disponibles aujourd’hui, tels que Claude 3.5 Sonnet, pour la majorité des tâches. Dans les cas où ce n’est pas le meilleur modèle, il peut déléguer à d’autres modèles et outils plus spécialisés », a déclaré M. Wilson. Si une image doit être générée, il appellera un modèle d’image. S’il a besoin d’une réflexion particulièrement poussée, il peut faire appel à un « modèle de raisonnement » tel que le GPT-4o. « Mais nous faisons ce choix avec notre plateforme et vous n’avez pas à vous en préoccuper en tant qu’utilisateur final. Le choix est fait par nous et vous pouvez être assuré que le meilleur modèle pour votre travail est toujours choisi », estime M. Wilson.
Modèle de gains
En tant qu’utilisateur final de Hunch, vous n’avez donc plus besoin d’ouvrir vos propres comptes ou d’acheter des abonnements premium à tous ces services d’intelligence artificielle. « Tout est compris chez nous. En tant qu’utilisateur, vous payez par tâche, en tokens Vous n’avez plus de tokens ? Ensuite, vous achetez des tokens supplémentaires, c’est aussi simple que cela », démontre le fondateur en décrivant le modèle de gains. Wilson promet des « prix raisonnables », mais ces formules ne semblent pas encore complètes. Ceux qui le souhaitent peuvent essayer Hunch gratuitement à l’adresse https://hunch.tools.

De la gestion des réseaux au travail de connaissances
Les fondateurs, David Wilson, Ross Douglas et Alex Leibhammer, ne sont pas des inconnus dans le monde de la technologie. Ils ont précédemment vendu leur startup Cape Networks, spécialisée dans la simplification de la surveillance des réseaux à l’aide de l’apprentissage automatique, à Aruba qui, à son tour, a ensuite été cédée à HPE. Ils appliquent désormais cette expérience de transposition de données complexes en informations exploitables dans le cadre du travail de connaissances. L’objectif n’est pas tant de remplacer complètement le travail existant, mais de permettre l’accomplissement de tâches qui sont aujourd’hui trop fastidieuses ou pénibles.
Exemples
David illustre son propos avec une agence de marketing qui utilise Hunch pour récupérer en une matinée des milliers d’URL de toutes ses sous-marques pour un client potentiel, analyser les données et les utiliser pour créer un site web de démonstration entièrement fonctionnel dans le cadre de son argumentaire de vente. « Il peut être utilisé pour s’acquitter de bien plus de tâches qu’aujourd’hui, au lieu de se borner à automatiser les tâches actuelles », conclut David. L’ambition est de traiter le travail de connaissances répétitif comme une « infrastructure en tant que code », mais pour les processus métier : décrits en langage humain et exécutés de manière fiable par un essaim d’agents d’intelligence artificielle spécialisés.
Un succès viral sur LinkedIn comme preuve de concept
Avez-vous également remarqué, à la fin de l’année dernière, qu’un grand nombre de vos contacts sur LinkedIn ont soudainement publié un résumé de leurs activités sur la plateforme ? Ce « LinkedIn Rewind » est l’œuvre de l’équipe de Hunch : conçu principalement pour démontrer la puissance de leur plateforme sous-jacente et construit en seulement quatre jours comme un « gadget amusant ». Mais « LinkedIn Rewind » a été adopté et est devenu viral en un rien de temps. « En deux semaines, plus de 300 000 personnes ont utilisé l’outil », se souvient David comme si c’était hier.
L’outil a analysé les messages et l’expérience d’un utilisateur sur LinkedIn au cours de l’année écoulée et a généré une « carte des points forts » partageable, similaire à Spotify Wrapped : le bilan annuel personnel des utilisateurs de Spotify, qui connaît un grand succès. Le LinkedIn Rewind présente non seulement des statistiques, mais aussi des éléments tels que les « meilleures citations » et un « superpouvoir » dérivé du contenu des messages.