Stable Audio: le premier outil de Stability AI à convertir du texte en audio

Tom Verpaelst Rédacteur chez Data News.

Rédacteur chez Data News. 15-09-2023, 11:39 Mise à jour le: 15-09-2023, 14:02

Stability AI lance avec Stable Audio un outil en ligne qui produit un échantillon audio basé sur quelques mots-clés. Un outil extrêmement populaire, semble-t-il, car en raison de la ruée du grand public, Stability AI doit déjà mettre en garde contre un éventuel écran vierge.

Stability AI est connue pour ses outils très populaires au sein de la communauté IA. Semblable au modèle Stable Diffusion – un outil qui génère des images par IA sur base de votre description –, l’entreprise propose désormais un nouvel outil, mais avec du son. Le programme Stable Audio est formé au moyen de la bibliothèque audio d’AudioSparx et peut produire ‘de la musique de haute qualité à 44,1 KHz à usage commercial’, selon Stability AI. A titre de comparaison: 44,1 KHz correspond à la qualité d’un CD.

Lisez aussi: D’A(I)madeus à AIsis: vous n’en croirez pas vos oreilles avec l’intelligence artificielle

L’utilisation de l’outil est simple. Vous vous connectez – en vous inscrivant simplement via votre compte Google ou via une autre adresse e-mail – et vous pouvez immédiatement être opérationnel. La présentation parle d’elle-même: dans le coin supérieur gauche, vous saisissez des mots clés, comme piano, guitare, voire tonnerre, pour lesquels vous souhaitez entendre un fragment audio. Ci-dessous, vous pouvez choisir exactement la durée du fragment, d’1 à 45 secondes maximum. Et c’est parti.

Il est important de mentionner que l’outil ne peut fonctionner qu’avec du son instrumental. Pas de chance donc pour ceux qui voulaient convaincre leurs suiveurs Instagram de leur talent de chanteur. Si vous avez de bonnes connaissances audio, les fragments seront d’autant meilleurs. L’outil ne convient pas encore pour un usage professionnel. C’est pourquoi Stability AI sollicite également les avis des utilisateurs, afin d’optimiser le programme à l’avenir.

Commercial

Cette première version de l’outil IA est gratuite pour les utilisateurs ordinaires. Dans cette version gratuite, vous pourrez générer jusqu’à 20 fragments audio, chacun d’une durée maximale de 45 secondes. Le problème, c’est que cette version est strictement destinée à un usage non-commercial. Ceux qui souhaitent utiliser l’outil dans l’intention d’exploiter les échantillonsà des fins commerciales, peuvent acheter un forfait mensuel professionnel pour 11,99 dollars par mois. Ou prendre contact avec l’entreprise pour faire établir un plan d’entreprisesur mesure. Avec l’abonnement professionnel, vous pourrez générer jusqu’à 500 fragments audio d’une durée maximale de 90 secondes et utiliser le son à des fins commerciales.

Reste à savoir si Stable Audio for Stability AI sera un succès. Durant les premières heures de vie de l’outil, il attire cependant de nombreux curieux. Lorsque vous recherchez le programme, vous risquez donc de recevoir le message suivant:

‘Nous enregistrons beaucoup de trafic. Le lancement de Stable Audio a suscité beaucoup d’intérêt, et nos systèmes ont du mal à suivre. Nous mettons tout en œuvre pour résoudre ce problème. N’hésitez pas à vous connecter et à commencer à générer de l’audio, mais il est possible que vous découvriez un écran vierge. Si tel est le cas, nous en sommes désolés. Nous vous conseillons de réessayer demain.’

Lire plus de: