Le nouvel ordinateur Go se passe de l’homme
DeepMind, la branche de recherche de Google dans le domaine de l’intelligence artificielle, a présenté un ordinateur qui a tout appris par lui-même du jeu de plate-forme Go. Il a battu sur la marque de 100 à 0 son prédécesseur, qui a lui encore besoin de données humaines pour son apprentissage.
Go est un jeu de plate-forme subdivisé en 361 cases. Pour chaque coup, il existe tellement de possibilités qu’il est incroyablement malaisé de programmer un ordinateur, afin qu’il maîtrise le jeu. A l’aide de réseaux neuraux, Deepmind a toutefois réussi à concevoir un ordinateur capable d’apprendre Go. ‘Apprendre’ peut ici être pris au sens littéral car AlphaGo s’est vu présenter des parties effectuées par des joueurs humains, qu’il a utilisées pour s’entraîner.
L’année dernière, AlphaGo avait étonnamment battu le champion du monde coréen Lee Sedol sur le score de 4-1, ce qui avait été considéré comme un véritable événement pour la recherche sur l’intelligence artificielle.
Table rase
Or voici que son successeur, AlphaGo Zero, peut même se passer de l’assistance humaine. On lui explique simplement les règles, et il recherche ensuite tout le reste de lui-même. Alpha Go Zero devient son propre professeur et joue contre lui-même. En tentant des deux côtés du jeu quelques coups et en calculant ses chances de succès, Zero est parvenu à maîtriser les finesses du jeu de Go. Au bout de trois jours d’entraînement, il a réussi à battre son prédécesseur AlphaGo une centaine de fois successives.
Le fonctionnement du nouvel ordinateur Go a été décrit par Deepmind dans un article paru dans la revue Nature. ”Le fait que l’algorithme parte d’une page vierge, le rend nettement plus puissant que les versions précédentes. En n’exploitant que les principes de base du jeu et plus des données humaines, nous avons contourné les limites de notre connaissance humaine’, a déclaré son auteur principal, David Silver.
Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici