Dr. Jure Leskovec : ‘On ne peut pas toujours monétiser une bonne interaction sur une plateforme’

© Getty Images
Els Bellens

Les réseaux et les interactions sont à la base de nos réseaux sociaux, mais aussi des moteurs de recommandation sur les sites web et même des bases de données dans les entreprises. Durant toute sa carrière de scientifique des données, le Dr Jure Leskovec a étudié l’apprentissage automatique sur les réseaux, notamment chez Twitter et Pinterest. ‘Un système est souvent incroyablement nuancé. ‘

Nous nous sommes entretenus avec Leskovec à l’Université d’Anvers, où il a été nommé docteur honoris causa à la fin du mois de mars pour ses travaux sur l’IA et l’apprentissage automatique. Au début de sa carrière, il a étudié la viralité des informations sur les réseaux sociaux. Il a également travaillé pour Pinterest, entre autres, où il a mis au point des systèmes de « recommandation ». Entre-temps, il a fondé une entreprise qui construit des modèles d’IA spécifiques pour les données d’entreprise.

Vous avez construit plusieurs systèmes de recommandation, ou « recommendation engines ». Comment démarrer un tel projet ?

Leskovec : Il faut toujours connaître l’objectif et les critères de réussite. Il est important de pouvoir mesurer ce que le succès signifie pour vous. Dans le cas d’un système de recommandation, ce ne sont pas les suggestions que vous faites aux utilisateurs qui vous intéressent, mais leur effet. Il s’agit d’un processus itératif, car les modèles d’IA sont formés sur la base de comportements antérieurs et de données étiquetées.

Dr. Jure Leskovec © Wikipedia

Nous travaillons toujours par interactions, par exemple « tel utilisateur a cliqué sur tel élément ». Mais la question est de savoir quelles données choisir pour entraîner votre modèle. L’un des premiers projets que nous avons menés chez Pinterest concernait les nouveaux utilisateurs qui se connectaient à la plateforme. L’idée était de leur permettre de cliquer sur certains centres d’intérêt et, en fonction de ceux-ci, leur recommander des épingles. Cela dans le but de stimuler leur utilisation de la plateforme. Au départ, nous avons construit un système qui prédisait les centres d’intérêt qu’ils choisiraient, et par la suite les utilisateurs ont choisi deux fois plus de centres d’intérêt qu’auparavant.

On peut dire que c’est un succès. Mais lorsque nous avons fait un état des lieux un mois plus tard, nous n’avons constaté aucune différence dans le nombre d’utilisateurs fidélisés. Nous leur avions partagé des recommandations, mais cela n’a pas eu l’effet escompté. Nous voulions en effet qu’ils reviennent sur la plateforme. Nous avons donc dû repartir de zéro et regarder ce que choisissaient les personnes qui restaient sur la plateforme. Nous voulions prédire ce que ces personnes-là sélectionnaient, et non ce qui intéressait les utilisateurs en général.

Qui ne s’intéresse pas aux « voyages », à la « cuisine » ou au « design » ? Tout le monde va cliquer dessus. Mais souvent, il y a des différences pour chaque utilisateur. Ainsi, dans la deuxième version du moteur, les propositions étaient beaucoup plus précises. Êtes-vous intéressé par des vacances en sac à dos ou des vacances exotiques, par des voyages en montagne ou des vacances en Méditerranée, etc. Et cela fait une grande différence.

Lorsque je pense aux systèmes de recommandation, je pense par exemple à ce que faisait Amazon avec « les utilisateurs qui ont cherché ceci ont également acheté cela », ou à ce que fait Netflix pour vous orienter vers de nouveaux produits.

Leskovec : On distingue deux types. D’une part, il y a les propositions d’article à article, où vous commencez par examiner un produit et essayez ensuite d’en proposer un autre. D’autre part, on peut également lier un utilisateur à un article. Supposons que vous souhaitiez présenter une série de films à un utilisateur.  C’est la différence entre « voici un utilisateur, ces films pourraient vous plaire » et « vous cliquez sur un film et voici des films similaires ». Il s’agit d’essayer de prédire l’action suivante, mais la vraie question est de savoir quel en sera l’effet sur l’expérience globale.

Avec le clickbait, les utilisateurs cliquent plus souvent à court terme, mais vous empoisonnez l’écosystème à plus long terme

Sur Pinterest, nous voulions suggérer des épingles, mais de quelle façon ? L’objectif est-il de recommander des épingles sur lesquelles vous allez cliquer ? Ou de recommander des épingles que vous allez sauvegarder ? Si vous optez pour des clics optimisés, l’effet clickbait est garanti. À court terme, les utilisateurs cliqueront plus souvent, mais vous empoisonnez l’écosystème à long terme. Si vous voulez suggérer des épingles qui assurent la satisfaction des utilisateurs, il s’agit d’épingles qu’ils ont trouvées et qu’ils veulent sauvegarder. Nous considérons qu’il s’agit d’une bonne interaction. Elle n’est pas d’emblée monétisable, mais elle fonctionne, ce qui est plus difficile à atteindre que le clickbait.

Avez-vous des exemples de relations entre produits qui conduisent à de telles propositions ?

Leskovec : On observe généralement deux types de relations entre les produits. La première est une relation de substitution, où un smartphone s’oppose à un autre. La seconde est une relation de complémentarité. Une personne qui achète un smartphone aura aussi besoin de câbles, d’écouteurs, peut-être d’un étui, etc. Le comportement humain suit majoritairement ces deux types.

En principe, l’algorithme ne doit même pas savoir ce qu’est un smartphone

À partir de là, on peut revenir à l’apprentissage automatique. L’algorithme apprend à faire le lien entre deux choses. Il apprend du comportement de l’utilisateur. En principe, l’algorithme ne doit même pas savoir ce qu’est un smartphone. Il ne doit pas savoir que ces choses plaisent aux jeunes ou au contraire aux personnes âgées, par exemple. Tout cela est dissimulé dans les données. Grâce à cette possibilité d’apprentissage, le système affiche souvent un niveau de nuances étonnant.

Observez-vous également des tendances sur les réseaux sociaux ? Par exemple, on a l’impression que les tendances virales s’accélèrent.

Leskovec : Nous avons travaillé avec Twitter pour voir comment les publications virales influencent le réseau social sous-jacent. À mesure que l’information se propage, en tant qu’utilisateur, vous pouvez par exemple voir qu’une publication partagée par quelqu’un est intéressante. Vous décidez donc de suivre la personne à l’origine de la publication parce qu’elle partage de bonnes informations. Cela signifie que le réseau s’optimise de lui-même. Puisque vous suivez la source originale, vous obtenez en principe des informations plus rapidement. Nous constatons qu’au fil du temps, les cascades (la séquence de reblogs par laquelle une publication se propage, NDLR) sont de plus en plus compressées. Les tendances se propagent plus vite, démarrent plus vite et disparaissent également plus vite. Mais cela signifie aussi que la diversification du contenu affiché s’amenuise au fil du temps, car le réseau est optimisé en fonction de vos centres d’intérêt.

Vous avez également effectué des recherches sur la propagation du coronavirus. Est-ce comparable à la propagation d’un mème, par exemple ?

Leskovec : Nous disposions de données sur la localisation des téléphones. De cette manière, nous pouvions approximativement voir que mon smartphone et votre smartphone se trouvaient à proximité, et que le virus s’était donc peut-être transmis de vous à moi. Grâce à ce réseau, nous avons pu construire des modèles beaucoup plus précis pour les épidémies via des réseaux dynamiques, simplement avec la technologie que chacun porte sur soi.

Ce type de recherche permet-il également de localiser les trous noirs dans le monde ? Les endroits qui ont moins de contacts avec le reste du monde ?

Leskovec : Il y a un seul vide, la Corée du Nord. Il y a une vingtaine d’années, je faisais des recherches chez Microsoft et l’entreprise avait une application de messagerie, Microsoft Instant Messenger. Nous avons analysé le réseau d’utilisateurs dans le monde entier. Il y en avait partout, sauf en Corée du Nord.

Il y a un seul vide dans le réseau mondial, la Corée du Nord

Mais il faut tout de même en tenir compte. Le taux de pénétration des smartphones est aujourd’hui d’environ 96 %, mais une partie de la population n’en possède toujours pas. Pensez par exemple aux détenus, à certaines personnes âgées ou aux jeunes enfants. Lors de la construction de systèmes, il faut tenir compte des lacunes dans les données. Il faut les comprendre et les corriger pour pouvoir tirer des conclusions. C’est indispensable pour faire de la science des données correctement.

Depuis, vous avez fondé votre entreprise d’IA, Kumo.ai. Que fait-elle ?

Leskovec : De nombreux réseaux neuronaux pour l’IA apprennent à partir d’images et de textes naturels. C’est également la base de ChatGPT, par exemple. Le modèle apprend à partir d’une séquence de mots et prédit le mot suivant. Mais les entreprises stockent leurs données privées dans des bases de données et des entrepôts de données, généralement sous forme de tableaux. Il y a le tableau clients, le tableau produits, les transactions, etc. Il s’agit de données comme « tel client a acheté tel article aujourd’hui », avec des informations dans trois tableaux : transactions, client, produit. Ce sont les données commerciales les plus utiles dont disposent les organisations. À partir de ces tableaux, on peut construire un système de détection de fraude, un système d’optimisation des prix, des prévisions de produits, etc. Le problème est que la plupart de ces modèles sont actuellement élaborés manuellement ; on utilise l’apprentissage automatique pour des fonctions spécifiques et ce n’est pas évolutif. Il faut entre neuf mois et un an pour construire un tel modèle de prédiction et commencer à en extraire de la valeur.

Nous créons donc un modèle de base capable d’apprendre à partir de vos données commerciales, comme ChatGPT le fait à partir de documents textuels. Nous avons développé un équivalent qui fait la même chose, mais avec des données d’entreprises privées. Et tout comme ChatGPT peut prédire le mot suivant, notre système peut prédire si une transaction est frauduleuse ou le prochain produit que le client va acheter. On commence actuellement à réaliser que les large language models ne peuvent pas résoudre ce type de problèmes. La technologie de Kumo change la façon dont les modèles sont construits sur la base des données commerciales les plus précieuses et dont les entreprises peuvent en extraire de la valeur.

Pour vous donner un exemple, nous travaillons notamment avec DoorDash, la plus grande entreprise de livraison de repas aux États-Unis. DoorDash voulait une fonction prédictive pour recommander des restaurants auprès desquels les utilisateurs n’avaient encore jamais commandé. C’est assez difficile parce qu’en tant que client, vous n’y êtes jamais allé. Avec Kumo, nous avons pu construire un modèle beaucoup plus précis que ce que l’entreprise aurait pu faire en interne, et cela pourrait lui faire gagner 200 millions de dollars de plus par an.

Comment voyez-vous l’évolution de cette technologie dans 20 ans ?

Leskovec : Nous vivons actuellement une période palpitante. Il y a beaucoup d’investissements, mais aussi beaucoup de battage médiatique. Pour les LLM, on constate que la tendance est aux agents et assistants numériques. Presque une sorte de main-d’œuvre numérique, en somme. Un deuxième aspect est selon moi l’aspect prédictif. Ces agents numériques sont utiles pour les centres d’appels, par exemple, mais pour les décisions, l’IA prédictive est indispensable. Je m’attends à de fantastiques avancées dans ce domaine. Pour l’IA générative, la situation est pour l’instant plus ouverte. Il y a beaucoup de démonstrations et d’idées intéressantes, mais je pense que nous n’avons pas encore vu quels problèmes réels, qui ont une véritable valeur commerciale, peuvent être résolus.

 

 

 

 

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire