Une AI de Google capable d'isoler des voix

13/04/18 à 12:14 - Mise à jour à 12:13

L'intelligence artificielle (AI) - contrairement aux humains - éprouve encore des difficultés à reconnaître la voix de quelqu'un, lorsqu'il y a pas mal de bruit de fond. Google entend à présent changer cela.

Une AI de Google capable d'isoler des voix

© REUTERS

Quiconque a déjà tenté au sein d'une foule bruyante de soumettre des commandes vocales à son assistant numérique, sait que ce dernier identifie alors très malaisément sa voix. Google prépare par conséquent une solution étonnamment simple, qu'elle présente sur son blog.

L'entreprise américaine a développé un algorithme d'apprentissage profond ('deep learning') qui est capable d'isoler très clairement des voix au sein d'une foule. Le système examine dans ce but le visage de quelqu'un pour déterminer qui est en train de parler et ce qu'il dit exactement. C'est ainsi que la technologie peut isoler sans problème une personne qui parle sur un fond sonore. Même si deux orateurs veulent attirer l'attention au même moment, le programme est tout à fait capable de faire la distinction.

Fêtes virtuelles

Google a formé son AI en lui soumettant des 'fêtes virtuelles' intégrant différents orateurs et un tas de sons d'ambiance. Les chercheurs ont permis au programme d'apprendre à reconnaître le visage d'un orateur et à l'associer ensuite aux fréquences correctes sur un spectrogramme. Il en résulte que l'AI retient finalement une piste audio très claire qui isole l'orateur du bruit ambiant superflu.

La technologie se trouve encore dans une phase conceptuelle, mais Google annonce déjà qu'elle envisage pas mal d'applications pour le marché à la consommation. C'est ainsi que la qualité audio des conversations vidéo via Hangouts ou Duo pourrait être améliorée ou que des sous-titres plus corrects pourraient être générés automatiquement.

En savoir plus sur:

Nos partenaires