"Voici 20 ans, Google avait une vision fantastique : organiser et rendre accessible toute l'information disponible dans le monde. Et nous l'offrons désormais à des milliards de personnes, a déclaré Diane Greene, CEO de Google Cloud, dans son discours inaugural à Londres, devant un public de 8.000 personnes. Avec Google Cloud, nous entendons désormais offrir à des millions d'entreprises la technologie qui nous a permis d'organiser et de rendre accessibles leurs propres données. "
...

"Voici 20 ans, Google avait une vision fantastique : organiser et rendre accessible toute l'information disponible dans le monde. Et nous l'offrons désormais à des milliards de personnes, a déclaré Diane Greene, CEO de Google Cloud, dans son discours inaugural à Londres, devant un public de 8.000 personnes. Avec Google Cloud, nous entendons désormais offrir à des millions d'entreprises la technologie qui nous a permis d'organiser et de rendre accessibles leurs propres données. " La même démarche donc, mais au niveau des entreprises. Pour preuve, Google avait invité sur le podium des clients comme Airbus, Carrefour et SEP, chacun utilisant des plates-formes cloud différentes du géant technologique, depuis les services d'apprentissage machine jusqu'à la G Suite. D'emblée, l'intérêt porté à l'intelligence artificielle (IA) saute aux yeux, Google ambitionnant en effet de n'être plus un fournisseur de services cloud, mais de rendre l'IA et l'apprentissage machine accessibles à l'ensemble des entreprises, même celles qui ne disposent pas de 'data scientists'. " 80 % des données sont non structurées, fait remarquer Rajen Sheth, director of product management. Il s'agit de courriels, vidéos, etc. Grâce à l'apprentissage profond et à l'apprentissage machine, il est désormais possible de les exploiter. Mais c'est difficile vu la pénurie de scientifiques des données. " Du coup, Google propose sa solution Cloud IA, une plate-forme open source qui propose des services totalement gérés pour créer des modèles d'apprentissage machine. " Nous offrons des blocs de construction que l'on peut intégrer dans ses propres applications, poursuit Sheth. Il s'agit par exemple de blocs pour la reconnaissance d'images, la traduction, la conversion texte-voix, etc. " " L'analytique de données reste trop complexe, ajoute Sudhir Hasbe, director Product Management (Analytics) pour Google Cloud. Les plates-formes traditionnelles considèrent que l'utilisateur doit tout faire lui-même, depuis le contrôle jusqu'au 'performance tuning', etc., ce qui laisse peu de temps pour l'analyse proprement dite. C'est pourquoi nous voulons prendre toutes ces opérations et les assurer pour le client. Nous avons prévu toutes sortes d'outils pour la collecte de données, la recherche, la préparation, le pré-traitement, etc. " Grâce à des modèles, les services doivent permettre une analyse complète des données. Et ensuite ? D'autres outils sont disponibles. " Nous offrons aussi un portefeuille complet en apprentissage machine, ce qui permet de former facilement un modèle ", dixit Hasbe. L'une des grandes promesses de Cloud AutoML, l'offre de Google en apprentissage machine, est de ne pas obliger l'utilisateur à disposer d'expertise pointue pour utiliser la solution. " Une simple interface permet de choisir des modèles d'apprentissage machine et de les adapter aux besoins spécifiques de l'entreprise ", affirme Sheth. La preuve en est apportée par Sophie Maxwell, conservation technology lead à la Zoological Society London, un institut de conservation lié au London Zoo. Celle-ci évoque un instrument typique utilisé par nombre de chercheurs spécialisés en animaux : le piège photographique. Des caméras sont dispersées sur une zone précise, chacune étant équipée d'un capteur de prise de vue qui détecte les mouvements. L'objectif est d'observer des animaux rares et de les recenser dans la zone concernée. " Mais les données récoltées dans ce type de projet sont très variées, explique Maxwell. On y retrouve des images floues, mais aussi des photos d'animaux qui ne sont nullement menacés ou qui ne sont pas pertinents dans le cadre de la recherche. Et avec 400.000 images par cycle d'observation, le travail pour les scientifiques est particulièrement fastidieux. " La solution réside, sans surprise, dans l'apprentissage machine. Un logiciel simplifié comme Google ML a permis d'entraîner un modèle sur un jeu 'labelisé' d'informations, afin que l'algorithme apprenne à reconnaître certaines espèces d'animaux rares. Ensuite, le système est testé sur un jeu de photos non labelisées provenant de caméras installées à Bornéo. Le projet s'est révélé suffisamment réussi pour trouver un prolongement. " Au final, nous voulons construire une plate-forme qui permettra aux zoologues de partager leurs modèles pour des niches spécifiques, ajoute Sophie Maxwell, ce qui leur permettra par exemple de rechercher une espèce spécifique dans une région déterminée. " Les mêmes propos de Rajen Sheth sont revenus à plusieurs reprises durant la conférence. " Dans le monde, il y a nettement plus de développeurs que de scientifiques des données ou d'experts en apprentissage machine. " Du coup, Google approche ces développeurs via différents canaux. Ainsi, BigQuery ML permet aux développeurs SQL de développer l'apprentissage machine directement dans l'entrepôt de données, avec simplement quelques lignes de code, tandis que Kubeblow permet de faire tourner des analyses au-dessus de Kubernetes. Mais il s'agit là de l'aspect technique. Google offre l'infrastructure et la programmation sous forme d'une interface plus simple, mais ne résout pas forcément les problèmes que rencontre d'ores et déjà l'apprentissage machine, et notamment les bases de données qui ne sont pas bien équilibrées ou qui sont incomplètes. Google parviendra-t-elle à expliquer à un zoologue le concept 'garbage in, garbage out' ? Manifestement oui. Pour ce faire, Google entend manifestement d'abord miser sur la documentation. " Nous expliquons aux utilisateurs comment ils doivent coder correctement, explique Sheth. Si vous commencez avec des bases de données incomplètes, vous obtiendrez des algorithmes tronqués. Nous essayons aussi de développer des outils susceptibles d'être maîtrisés par les utilisateurs, ou tout au moins qu'ils comprennent la manière de les utiliser. " S'il ne tenait donc qu'à Google, chacun deviendrait demain un peu 'data scientist'.