Le géant technologique Meta présente un modèle d’intelligence artificielle conçu pour traiter et traduire du langage parlé et écrit. Il a été baptisé SeamlessM4T.

Il s’agit d’un modèle d’apprentissage machine capable d’identifier automatiquement les mots dans du texte ou dans un contenu audio et de les traduire. Le modèle peut automatiquement transcrire le contenu audio ou le convertir directement dans une autre langue.

L’entreprise se focalise aussi sur le modèle multimodal, capable d’assumer plusieurs tâches. ‘La création d’un traducteur universel, comme le Babel Fish fictif de The Hitchhiker’s Guide to the Galaxy, s’avère malaisée, parce que les systèmes existants ‘parole vers parole’ et ‘parole vers texte’ ne peuvent traiter qu’une partie des langues mondiales actuelles’, précise Meta dans un communiqué posté sur son blog. ‘Nous croyons cependant avoir accompli aujourd’hui un pas important dans la bonne direction.’

Apprentissage machine

SeamlessM4T succède à de précédent modèles de langage de Meta, dont No Language Left Behind. Selon le géant technologique, son traducteur peut traiter 101 langues par saisie vocale, et 96 langues par saisie et sortie textuelle. Le modèle est capable de proposer 35 langues en sortie vocale.

Les récents progrès enregistrés en apprentissage machine signifient que les logiciels de traduction semblent s’accélérer. Lors de sa récente conférence des utilisateurs IO, Google a ainsi annoncé un traducteur universel capable de doubler automatiquement la vidéo.