Le géant technologique Google est en train d'effectuer des modifications à son algorithme de recherche. Cela devrait permettre à un dixième des commandes de recherche d'obtenir d'autres résultats à l'avenir. Ces changements sont basés sur la technologie de traitement de la langue naturelle, ce qui revient brièvement à dire que le moteur de recherche va examiner un contexte plus large.

Google déclare mieux comprendre à présent comment les mots sont liés les uns aux autres dans une phrase (en anglais). Et l'entreprise de citer un exemple dans un communiqué posté sur son blog, en l'occurrence la phrase (traduite): "Pouvez-vous aller chercher des médicaments pour quelqu'un chez le pharmacien?". L''ancien' algorithme de Google examinerait cette phrase comme une suite de mots pour en tirer les plus importants, tels médicaments et pharmacien, et y baser ses résultats de recherche. La nouvelle version, elle, prend aussi en compte 'pour quelqu'un' et comprend que la personne qui pose la question, veut savoir si vous pouvez aller à la pharmacie avec l'ordonnance de quelqu'un d'autre. Cela engendre donc d'autres résultats de recherche.

Le nouvel algorithme repose sur BERT (Bidirectional Encoder Representations for Transformers), une manière en Natural Language Processing (NLP) d'examiner toute une phrase de manière contextuelle. Pour former l'algorithme au contexte et au sens, le géant technologique a utilisé un réseau neural. Il a soumis le réseau à un ensemble complet de phrases en anglais, tout en en enlevant aléatoirement 15 pour cent des mots. Ensuite, le logiciel a été invité à déterminer les mots qui manquaient. Ce type de formation conviendrait pour faire comprendre au modèle NLP comment les mots interagissent dans un contexte.

Le nouvel algorithme a été déployé ces derniers jours et pourrait impacter quelque dix pour cent des commandes de recherche. Vu les milliards de commandes de recherche qui sont saisies quotidiennement dans le moteur de recherche le plus utilisé au monde, il s'agit là d'un important pas en avant. Google indique dès lors que les nouveaux résultats de recherche seront vérifiés au cours des tout prochains mois, notamment par toute une armée de correcteurs. L'un des problèmes posés par le réseau neural, c'est qu'on ne sait pas vraiment pourquoi il prend des décisions et aussi que des préjugés peuvent y pénétrer, qui se trouvaient peut-être involontairement dans la base de données. Avec une gigantesque série de phrases, ce dernier point semble quasiment inévitable. L'entreprise s'offre donc encore la possibilité de peaufiner tout cela.

Les changements cibleront d'abord les commandes de recherche exécutées en anglais aux Etats-Unis. D'autres langues et pays suivront.