Au début de ce siècle, l'homme a réussi à cartographier entièrement les plus de trois milliards de lettres de son code génétique. Lorsqu'une collaboration internationale se mit en 1990 à décomposer le génome humain, cela tenait encore de l'utopie. En raison des rapides progrès informatiques, le projet fut pourtant mené à bien en 2003 déjà, soit cinquante ans après la découverte de la molécule ADN.

Aujourd'hui, il est aussi possible de lire séparément la suite ADN unique de chaque humain ('séquençage'). Les coûts nécessaires sont à présent descendus sous la barre des mille dollars. Ce seul séquençage économique ne s'avère cependant pas suffisant: il fournit un livre de trois milliards de lettres dans un langage que l'on a du mal à déchiffrer. Les données obtenues doivent encore être 'traduites' en connaissance biologique. Ce type d'analyse des données du génome exige une grande puissance de calcul et peut prendre plusieurs semaines.

Pour que cette analyse du génome puisse s'effectuer plus rapidement, des groupes de chercheurs de l'Imec, de la KU Leuven, de l'UGent, de l'UZ Leuven et de trois entreprises ont créé conjointement la Genome Analytics Platform (GAP). Cette plate-forme combine les puissances de calcul dans le nuage et locale avec du stockage de données, afin de traiter la sortie complète d'une machine de séquençage en 48 heures seulement et ce, pour 48 génomes en même temps.

"Nous démarrons en prenant un échantillon d'ADN, que nous insérons dans une machine de séquençage. Celle-ci découpe le génome en fragments de quelque 100 signes de longueur (A, C T ou G), avant de les regrouper pour en faire une longue série de trois milliards de signes. Pour accélérer cette opération, nous utilisons des méthodes statistiques et l'intelligence artificielle. Normalement, tout ce processus dure cinq jours environ, mais nous l'avons ramené à une heure par génome", précise Roel Wuyts de l'ExaScience Life Lab de l'Imec.

La plate-forme GAP se compose de matériel local de Western Digital et d'une solution 'cloud' de BlueBee. Le logiciel d'analyse du génome optimisé répartit le travail entre l'armoire locale (le rack présent dans l'hôpital) et le nuage. Cela se passe de manière économique: le logiciel veille à ce que le matériel soit utilisé cent pour cent du temps.

Dans la pratique, il faut une journée pour préparer l'échantillon, deux pour le séquençage et un pour l'analyse. Il en résulte que le séquençage et l'analyse de l'ensemble du génome deviennent à la fois rapides et financièrement abordables pour les cliniques. Celles-ci pourront bientôt utiliser la plate-forme non seulement à des fins de recherche, mais aussi pour le traitement des patients dans la pratique quotidienne. Agilent, l'un des partenaires du projet, a déjà intégré la solution de plate-forme hybride dans un premier produit, qui est testé par l'UZ Leuven et le 'Departement Menselijke Erfelijkheid' de la KU Leuven, afin de mieux traiter les patients.

Respect de la vie privée

Lors de l'analyse, le génome est comparé à d'autres génomes, par delà les frontières des cliniques individuelles. Ces génomes ne peuvent toutefois pas être échangés facilement. Comme votre génome ne peut tomber entre des mains indélicates, un cryptage spécifique est exigé. "Il convient d'y ajouter un système de gestion des utilisateurs: qui a accès aux génomes? Qui peut y effectuer une analyse et laquelle?", explique Wuyts.

Il convient aussi de tenir compte de ces restrictions en matière de respect de la vie privée, si l'on veut développer une intelligence artificielle en vue d'aider à interpréter le gisement de données. "Nous ne pouvons pas centraliser d'informations. C'est différent de ce qui se fait avec pas mal de systèmes d'apprentissage machine existants. Ces algorithmes sont surtout l'affaire d'entreprises technologiques américaines ou des autorités chinoises, qui tentent de collecter le plus de données possible. En Europe, nous essayons d'inverser les choses. On n'a accès qu'aux informations dont on a besoin, pas à un million de génomes."

Vers des machines de séquençage mobiles?

Le séquençage du génome devient toujours plus rapide et économique. Il s'agit d'une évolution ultrarapide. Que peut-on attendre d'ici cinq ans? Lire un génome au moyen d'un smartphone? "On y travaille", répond Wuyts en souriant. "Pour commencer, je m'attends à ce que les techniques de séquençage se réduisent et s'accélèrent. Les trois premiers jours devraient pouvoir être ramenés à quelques heures. Il existe dès à présent plusieurs appareils plus compacts sur le marché, même si la marge d'erreur y est encore quelque peu plus grande que chez les grands appareils cliniques."

"Je pense que d'ici cinq ans, nous disposerons de machines de séquençage portables, dans lesquelles les algorithmes d'analyse seront déjà présents", prévoit Wuyts. "On pourrait alors montrer directement au médecin les 'leçons' de la définition et de l'analyse du séquençage d'un génome complet, et le médecin pourra alors aborder avec son patient les principaux résultats et les traitements possibles. Peut-être même une heure après la prise de l'échantillon."