Watson Analytics est un outil de décisionnel pour les non-professionnels

© Watson Analytics

Avec Watson Analytics, IBM dévoile un outil d’analyse abordable pour données d’entreprise et de médias sociaux, susceptible d’être interrogé en langage ordinaire. Soit une alternative aux grands outils de BI utilisé surtout par des spécialistes.

Vers le milieu des années ’80 du siècle dernier, j’avais réalisé pour la BRT de l’époque un long reportage sur l’intelligence artificielle (IA). Parmi les spécialistes interviewés, ce domaine suscitait un grand optimisme. Un optimisme qui ne s’est pas confirmé. Le prof. Luc Steels, qui avait fondé en ’83 l’Artificial Intelligence Laboratory à la Vrije Universiteit Brussel et que j’avais interrogé à l’époque, déclarait récemment (9 janvier) au quotidien De Tijd : “Un enfant de 3 ans est parfois plus intelligent qu’un robot.” Et de réagir ainsi au projet du fondateur de Facebook Mark Zuckerberg de concevoir un robot qui ferait office de serviteur.

“L’intelligence [des robots] est la même depuis des décennies déjà. Elle est basée sur des algorithmes mis au point voici 30 ans déjà”, dixit Steels. Reste que la signification pose un énorme défi à l’IA.

Deep learning

Vous rétorquerez sans que l’IA existe bel et bien. Ainsi, récemment encore, l’ordinateur DeepMind de Google l’emportait sur le champion du monde de Go, Lee Sedol. De même, à la fin des années ’90, le Deep Blue d’IBM battait le champion des échecs Gary Kasparov. Tandis que Watson d’BIM remportait le quizz américain ultra-compliqué Jeopardy.

Reste que tous ces exemples n’ont que peu de rapport avec l’intelligence artificielle. En effet, il s’agit là d’autant d’exemples de ‘deep learning’ ou de grande érudition, en d’autres termes de réseaux artificiels neuronaux. Du fait de l’explosion de la puissance de calcul et des énormes volumes de données collectées, de tels systèmes peuvent donner une impression d’intelligence. Mais cela n’a que peu de rapport avec l’IA à part entière ou l’artificial general intelligence (AGI).

Le système vous suggère un certain nombre de questions à poser: ‘Combien de fois telle ou telle valeur apparaît-elle?’, ‘Quel est le rapport entre telle et telle valeur?’, ‘Comment la valeur X se comporte-t-elle par rapport à la valeur Y?’

Reste qu’il ne faudrait pas balayer d’un revers de manche les capacités et l’utilité de systèmes de grande érudition comme DeepMind et Watson. Ainsi, IBM exploite toujours plus sa technologie Watson dans des applications commerciales, notamment en l’intégrant dans son outil de communication professionnel Verse que nous avions testé en octobre dernier (voir nos archives en ligne pour abonnés).

Et récemment, s’est achevé la phase bêta lancée en 2014 d’IBM Watson Analytics, un outil de décisionnel convivial désormais disponible dans plusieurs versions commerciales. Watson dépend d’ailleurs d’une division spécifique de 2.000 collaborateurs au sein d’IBM et représente désormais un investissement de 1 milliard $.

Outre Watson Analytics, cet IBM Watson Group prend en charge deux autres services à base cloud, à savoir Watson Discovery Advisor, qui assiste les entreprises pharmaceutiques dans la recherche de nouveaux médicaments et formules, et Watson Explorer, un moteur de recherche intelligent pour données d’entreprises massives, qu’elles soient structurées ou non. Ces trois produits peuvent également être intégrés via l’API Watson ouverte, dans des systèmes et logiciels d’entreprise tiers.

La BI pour les nuls

Watson Analytics est globalement un outil de décisionnel pour les non-professionnels, permettant d’effectuer des analyses en langage naturel sur des jeux de données. Il ne remplace donc pas les grands outils de BI tels qu’IBM Cognos pour l’analyse de données d’entreprise par des spécialistes.

Il s’agit plutôt d’un outil d’analyse simple pour des applications spécifiques comme les marketeers qui souhaitent générer rapidement un rapport sur une tendance déterminée ou un événement sans devoir faire appel au département BI. Le système peut être enrichi de différentes données d’entreprise, à condition de les injecter dans un format de tableur (Excel ou .csv) ou le format saf d’IBM SPSS Statistics sur un disque (réseau) local ou un disque cloud comme Dropbox, Box ou Microsoft OneDrive.

IBM ajoute constamment de nouvelles fonctionnalités. Depuis la fin de l’an dernier, IBM Watson peut aussi exploiter des données de médias sociaux (Twitter, forums, review sites) pour autant qu’ils soient en anglais, français, allemand ou espagnol.

Avec Watson Analytics for Social Media, il est possible de trouver des réponses à des questions comme “quelles sont les caractéristiques les plus évoquées de mon produit ou de ma gamme de produits ?”, “quelle est la réputation des vendeurs que j’envisage ?” ou “qu’est-ce qui intéresse le plus les votants dans ma zone d’élection ?”.

Fonctionnement

Durant notre test, nous avons utilisé une feuille de calcul de dizaines de milliers de notifications SAP et de différents fichiers xls de data.gov.be. Une fois ce jeu de données chargé, le système vous demande d’indiquer d’éventuels titres de colonnes. Watson analyse les données et leur attribue un chiffre de qualité entre 1 et 100.

Vous pouvez ensuite affiner votre jeu de données en renommant ou en triant notamment vos colonnes ou lignes, en excluant des lignes, en marquant autrement le contenu des cellules ou en modifiant la manière dont les données sont rassemblées.

Les meilleurs résultats s’obtiennent en laissant Watson travailler sur des jeux de données dont vous êtes quelque peu familier

Watson Analytics vous aide à affiner le jeu de données en attribuant aux colonnes chiffrées un chiffre de qualité. Ainsi, vous pouvez exclure les colonnes ayant une qualité basse parce qu’elles contiennent par exemple trop peu de données pour permettre une analyse pertinente.

Cela peut améliorer sensiblement la qualité des données, tandis qu’il peut être intéressant de faire d’abord ce type de tri. Ainsi, nous avons pu améliorer la qualité du jeu de données ‘Pourcentage de ménages ayant un ordinateur’ de data.gov.be de 54/100, soit ‘moyen’, à 92/100, soit ‘élevé’.

Dès que vous cliquez sur votre jeu de données, le système vous suggère un certain nombre de questions à poser : “Combien de fois telle ou telle valeur apparaît-elle ?”, “Quel est le rapport entre telle et telle valeur ?”, “Comment la valeur X se comporte-t-elle par rapport à la valeur Y ?”, “Quelle est la valeur la plus courante dans la colonne X ?”, etc. Vous pouvez aussi poser vos propres questions en vous aidant éventuellement de l’assistant ‘Ask a question’.

Outre des analyses, le système permet de faire des prévisions sur votre jeu de données. Vous définissez en l’occurrence 5 ‘cibles’ (5 types de données), le cas échéant aussi à l’aide de l’assistant.

Enfin, vous rassemblez les résultats dans le module Assemble pour créer des aperçus sous forme de rapports avec des infographiques, des présentations de dias ou des lignes du temps en cliquant et faisant glisser simplement les données provenant du jeu de données. Les rapports ainsi créés peuvent être réutilisés et complétés par de nouvelles données, à condition de conserver le format du jeu de données.

Editions

La version gratuite de Watson Analytics traite des jeux de données pour tableurs de 500 Mo maximum avec 100.000 lignes et 50 colonnes. La version Plus que nous avons testée est prévue pour des jeux de données de 2 Go avec 1 million de lignes et 256 colonnes au maximum. Cette version comprend également l’ajout Social Media, plus la possibilité d’importer des données provenant d’IBM Cognos Business Intelligence. Et des données supplémentaires peuvent être achetées par paquets de 10 Go. Cette version coûte 29,95 € par utilisateur et par mois.

Enfin, la version Professional, dont nous avons reçu une démo, permet à plusieurs utilisateurs de travailler sur les mêmes jeux de données, soit une taille maximale de 100 Go avec 10 millions de lignes et 500 colonnes, tandis que des données supplémentaires peuvent être achetées à concurrence de 50 Go. Cette version revient à 77,2 € par utilisateur et par mois. Elle permet de partager avec d’autres des jeux de données existants, des prévisions, des interrogations et des vues.

Conclusion

Watson Analytics permet, grâce à des questions et réponses simples, d’analyser des jeux de données aléatoires sans connaissance particulière des opérateurs booléens, des formules Excel ou des requêtes SQL. Les meilleurs résultats s’obtiennent en laissant Watson travailler sur des jeux de données dont vous êtes quelque peu familier. De la sorte, vous posez les questions pertinentes et pourrez effectuer des analyses de données vraiment utiles moyennant un effort relativement limité.

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire