Spotify ouvre les marchés des langues étrangères à ses podcasteurs grâce à l’intelligence artificielle.
La société a annoncé lundi un programme pilote appelé Voice Translation pour les podcasts qui non seulement traduit un podcast d’une langue à une autre, mais conservera la voix du podcasteur pendant qu’il le fait.
Le nouvel outil de traduction de Spotify, qui utilise la technologie de génération vocale d’OpenAI, peut cloner les caractéristiques vocales d’un locuteur pour rendre une traduction plus naturelle.
Le programme pilote présentera une sélection de podcasts de Dax Shepard, Monica Padman, Lex Fridman, Bill Simmons et Steven Bartlett, traduits en espagnol, français et allemand.
À l’avenir, Spotify prévoit également de traduire des épisodes de « eff won with DRS » de Dax Shepard, « The Rewatchables » de The Ringer et le nouveau podcast original de Trevor Noah qui sera lancé plus tard cette année.
« En faisant correspondre la voix du créateur, Voice Translation donne aux auditeurs du monde entier le pouvoir de découvrir et de s’inspirer de nouveaux podcasteurs d’une manière plus authentique que jamais », a déclaré Ziad Sultan, vice-président de la personnalisation de Spotify, dans un communiqué.
« Nous pensons qu’une approche réfléchie de l’IA peut aider à établir des liens plus profonds entre les auditeurs et les créateurs, un élément clé de la mission de Spotify visant à libérer le potentiel de la créativité humaine », a-t-il ajouté.
Avantages pour les podcasteurs et Spotify
Le nouvel outil de traduction pourrait être bénéfique à la fois aux podcasteurs et à Spotify. « La proposition de Spotify pourrait étendre la portée de ces podcasts à de nouveaux publics et à de nouveaux pays », a déclaré Greg Sterling, co-fondateur de Near Media, un site Web d’informations, de commentaires et d’analyses.
« Cela profite potentiellement à la fois à Spotify et au podcasteur en élargissant la portée de l’audience », a-t-il déclaré à TechNewsWorld.
Les podcasts anglais traduits en mandarin et en hindi auraient accès à de très vastes marchés auxquels ils n’auraient pas accès si le podcasteur ne parlait pas ces langues, a ajouté Rowan Curran, analyste chez Forrester Research, une société nationale d’études de marché dont le siège est à Cambridge. Masse.
« Cela représente une démocratisation des capacités de l’IA linguistique », a-t-il déclaré à TechNewsWorld. « Cela suit le modèle des deux dernières années, où ces fonctionnalités très avancées sont devenues disponibles pour un très large éventail de personnes. »
Rob Enderle, président et analyste principal du groupe Enderle, une société de services-conseils basée à Bend, Oregon, a souligné que les podcasteurs augmenteront non seulement leur audience, mais aussi leur portefeuille, car plus leurs podcasts captiveront d’oreilles, plus plus les revenus potentiels qu’ils peuvent générer sont élevés.
Il en va de même pour Spotify. « Chaque artiste peut générer plus de revenus ; les plus performants rapporteront beaucoup plus d’argent à l’entreprise », a-t-il déclaré à TechNewsWorld.
Pression pour que les investissements soient rentables
Ashu Dubey, co-fondateur et PDG de Gleen, une société d’IA générative basée à Pleasanton, en Californie, a convenu que l’outil de traduction pourrait avoir un impact positif sur les résultats de Spotify.
« S’il existe un podcast très demandé qui est enregistré uniquement en anglais, alors cette technologie pourrait exposer ce programme à un public au Japon ou en France, par exemple, et aider Spotify à vendre davantage d’abonnements dans ces pays », a-t-il déclaré à TechNewsWorld.
Spotify a vraiment besoin de vendre plus d’abonnements, a soutenu Todd Cochrane, PDG de Blubrry Podcasting, un service d’hébergement et de distribution de podcasts à Traverse City, Michigan.
« Ils ont besoin d’un plus grand nombre d’auditeurs pour monétiser, car ils sont soumis à une pression extrême pour que leurs investissements d’un milliard de dollars récupèrent l’argent qu’ils ont perdu », a-t-il déclaré à TechNewsWorld.
Spotify a conclu des accords très médiatisés ces dernières années, notamment un accord exclusif pluriannuel de 200 millions de dollars avec le podcasteur Joe Rogan, 196 millions de dollars pour le site de sport et de culture pop Ringer et 56 millions de dollars pour la société de production Parcast, connue pour son podcasts sur de vrais crimes.
Même si Spotify est désormais en avance avec son outil de traduction, son avance pourrait rapidement s’essouffler. « Il ne s’agira pas seulement de la technologie de Spotify », a prévenu Curran, « Spotify est la première grande plateforme de créateurs à faire cela, mais il faudra peu de temps avant que nous voyions cela sur des plateformes comme YouTube. »
Technologie potentiellement dangereuse
Malgré les avantages du nouvel outil de traduction de Spotify, sa technologie sous-jacente présente également un côté sombre.
« La technologie peut être très dangereuse et potentiellement exploitante », a déclaré Sterling. «Il est déjà utilisé dans des fraudes et des escroqueries. Et il existe déjà des utilisations non autorisées de clones de voix de célébrités dans les enregistrements de livres audio.
« Il doit être utilisé avec prudence et dans tous les cas avec la permission du sujet », a-t-il poursuivi. « Mais le déséquilibre des pouvoirs entre les plateformes et les individus qui y participent pourrait ne pas générer des cas d’utilisation équitables de l’IA vocale. Il faut mettre en place des lignes directrices claires et éthiques.
«C’est l’un des enjeux de la grève des acteurs, toujours en suspens. Les studios ont-ils le droit d’exploiter la voix et l’image d’un acteur à perpétuité et sans autorisation ? il ajouta.
Dubey a souligné que l’outil de traduction pourrait être soumis à ce fléau des applications de l’IA : les hallucinations.
« Cela pourrait arriver si le podcasteur utilisait une phrase qui n’avait pas vraiment d’expression équivalente dans la langue traduite », a-t-il expliqué.
« Par exemple, » a-t-il poursuivi, « le terme allemand « schadenfreude » n’a pas vraiment de traduction stricte dans la plupart des langues, donc une IA qui s’appuie uniquement sur un grand modèle linguistique pourrait finir par halluciner la traduction et mettre les mots dans le bon sens. bouche des podcasteurs.
Exécution, clé du succès
Les traductions pourraient également créer des problèmes juridiques pour les podcasteurs.
« Si la technologie de l’IA ne parvient pas à fournir une traduction précise du contenu d’un créateur de podcast, celui-ci pourrait faire face à des conséquences juridiques, telles que la diffamation ou des violations de la FTC », a noté Alyssa J Devine, PDG et fondatrice de Purple Fox Legal, un cabinet d’avocats un focus sur le droit de la propriété intellectuelle pour les entrepreneurs et les créatifs, à Nashville, Tennessee.
« La juridiction et le lieu appropriés pour de telles réclamations dépendraient des faits d’une situation spécifique, mais il n’est pas rare qu’un plaignant dans un pays obtienne un jugement contre un défendeur dans un autre pays », a-t-elle déclaré à TechNewsWorld.
L’exécution sera la clé du succès de la traduction vocale, a soutenu Cochrane.
« Si Spotify n’exécute pas cela correctement, il pourrait faire le contraire et nuire à tout le contenu des podcasts sur la plate-forme et détourner les auditeurs natifs non anglophones du contenu », a-t-il déclaré. « C’est un vrai risque si cela semble synthétique et sans inflexion. »
Mark N. Vena, président et analyste principal de SmartTech Research à San Jose, en Californie, et également podcasteur, a expliqué que traduire des podcasts peut être un défi.
« Lorsque vous traduisez des choses dans différentes langues, tout ce qui est dit dans une langue ne peut pas être proprement traduit dans une autre », a-t-il déclaré.
« Si la précision de la traduction n’est pas très bonne, cela va poser un problème », a-t-il poursuivi. « Il va également y avoir un problème avec le nettoyage de certains artefacts d’un podcast – les ‘euh’ et les ‘ah’ et les lacunes gênantes. »
« Je suis très sceptique quant à l’efficacité de cette mesure », a-t-il affirmé.