Une entreprise télécoms américaine rend la technologie vocale plus réaliste

Michael Ilegems Responsable musique Knack Focus

Le département recherche de l’entreprise télécoms AT&T prépare une technologie ‘naturelle’ qui convertit du texte en paroles. Cette technique pourra notamment être utilisée pour la lecture automatique de livres d’enfant.

Le département recherche de l’entreprise télécoms AT&T prépare une technologie ‘naturelle’ qui convertit du texte en paroles. Cette technique pourra notamment être utilisée pour la lecture automatique de livres d’enfant.

La technologie vocale actuelle est loin d’être parfaite. Des paroles sont encore trop souvent mal prononcées ou des intonations sont incorrectement placées. Au sein de l’entreprise télécoms américaine AT&T, l’on tente à présent de mettre au point une technologie vocale ‘naturelle’ plus réaliste, qui sera notamment utilisée dans les livres de lecture assistés par ordinateur destinés aux enfants.

Le but est de rendre aussi réalistes que possible les différentes voix des personnages et leurs intonations uniques. Mais c’est très compliqué, selon l’initiateur Taniya Mishra: “C’est un défi que de tirer automatiquement du texte les émotions personnelles des personnages, puis de prévoir la voix qui convient.”

La technologie permet entre autres d’utiliser la voix d’une personne connue – comme celle de la mère ou de la grand-mère d’enfants – pour lire l’histoire. Dans ce but, cette personne prononce d’abord quelques phrases standard dans le système. Mais le logiciel peut tout aussi bien générer lui-même des voix en suivant par exemple les conversations quotidiennes d’une famille.

Vous avez repéré une erreur ou disposez de plus d’infos? Signalez-le ici

Contenu partenaire