L’intelligence artificielle résout une énigme biologique vieille de cinquante ans

Els Bellens

DeepMind déclare avoir résolu l’un des problèmes classiques de la biologie. Le laboratoire AI de Google pourrait en grande partie prévoir comment les protéines se replient (‘protein folding’ en anglais).

Il s’agit là d’un problème auquel sont confrontés les biologistes depuis des années déjà: le repliement des protéines. Les protéines se replient en des figures tridimensionnelles uniques qui sont très malaisément prévisibles. Or si on connaît la forme prise par une protéine, on sait mieux quelle fonction elle remplit, ce qui peut aider dans la lutte contre toute une série de maladies et dans le développement de nouveaux médicaments, y compris contre le covid-19.

Voilà pourquoi le problème est soumis depuis pas mal de temps à toutes sortes de moyens technologiques. Comme les prévisions exigent une très grande puissance de calcul, il existe depuis 2000 par exemple Folding@Home, un petit programme qui utilise les ordinateurs d’utilisateurs bénévoles en vue de résoudre l’énigme.

Voici qu’à présent, DeepMind, une filiale de Google, déclare que le problème des prévisions est en grande partie résolu. Le programme du spécialiste de l’intelligence artificielle pourrait déterminer la forme des protéines avec la même précision que celle de méthodes plus coûteuses et de plus longue haleine en laboratoire.

Protéines et acides aminés

Les protéines se composent d’une série d’acides aminés qui se replient de manières quasiment infiniment différentes. Savoir comment les acides aminés se replient peut révéler le rôle qu’ils jouent dans certains processus chimiques et fonctions corporelles essentielles. Découvrir leur forme peut ainsi aider à mettre au point de nouveaux médicaments. Le problème, c’est que rien que dans le corps humain, il y a déjà des milliers de protéines différentes et que la modélisation d’une telle protéine dure parfois des années en laboratoire.

Voilà pourquoi on prépare depuis pas mal de temps déjà une solution permettant des prévisions. Cela se fait sur base d’un séquençage des blocs d’acides aminés générant une protéine. Ce séquençage est en effet nettement plus facile à déterminer. La méthode, pour laquelle Christian Anfinsen a reçu le prix Nobel de chimie en 1972, est utilisée depuis des années déjà dans le cadre d’une sorte de compétition, le CASP (Critical Assessment of protein Structure Prediction). Des équipes d’une vingtaine de pays tentent en effet tous les deux ans de prévoir au moyen de programmes informatiques les formes d’un ensemble de cent protéines sur base du séquençage de leurs acides aminés. Ces mêmes acides aminés sont simultanément analysés par un laboratoire utilisant des techniques plus traditionnelles pour déterminer la forme 3D.

A la fin, les résultats sont comparés, et le programme AlphaFold de DeepMind a obtenu cette année un score qui, selon le jury du concours, est comparable à celui obtenu par le laboratoire. Etant entendu qu’AlphaFold a eu besoin de sensiblement moins de temps et de main d’oeuvre pour y arriver.

AlphaFold

DeepMind exploite un système de 128 processeurs spécialisés qu’il a entraîné durant quelques semaines. Le système peut donc à présent effectuer en quelques jours la même prévision qu’un laboratoire après des années de recherche.

Dans une phase ultérieure, d’autres chercheurs examineront le programme de DeepMind pour vérifier la méthodologie. Il n’existe pas encore d’évaluation par les pairs (‘peer review’) comme cela s’appelle en jargon. On se base donc ici principalement sur la compétition susmentionnée et sur un communiqué posté sur le blog de DeepMind même. Il s’agirait néanmoins d’un pas particulièrement important accompli dans la bonne direction.

Une fois que la forme de protéines simples pourrait être prévue de manière précise et abordable, des chercheurs pourraient alors s’occuper de l’aspect plus chaotique d’éléments de la vie humaine. C’est ainsi que ces protéines semblent souvent s’agglutiner les unes aux autres, et on devrait aussi savoir comment elles collaborent avec d’autres molécules, comme l’ADN et l’ARN. Il s’agit là de structures plus complexes qui pourraient par exemple engendrer une percée dans la recherche sur le cancer.

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire