Spotify utilizará inteligencia artificial para traducir podcasts

Tendrá la misma voz y el estilo que los originales. La función se creó en colaboración con OpenAI y ChatGPT

BAE Negocios

Spotify empezará a utilizar inteligencia artificial para traducir podcasts a otros idiomas, según informó la empresa este lunes en el marco de una asociación con OpenAI, con lo que la compañía se convierte en la última en utilizar IA generativa para sus productos.

Los voceros de la empresa adelantaron que lanzarán una versión piloto de su función "Traducción de voz", que traducirá podcasts a otros idiomas con la misma voz y estilo que el locutor original.

La función se creó en colaboración con OpenAI, que anunció el lunes nuevas "capacidades de voz e imagen" para ChatGPT, lo que permitirá a los usuarios hablar con el chatbot de IA con "audio similar al humano generado a partir de solo texto y unos segundos de muestra de habla".

 

La nueva característica de Spotify se basa en la herramienta de transcripción de voz Whisper de OpenAI, que transcribe el habla inglesa y traduce otros idiomas al inglés.

El programa piloto incluye tres episodios de podcasts -incluidos Lex Fridman Podcast, Armchair Expert y The Diary of a CEO with Steven Bartlett- disponibles en español para usuarios suscritos y no suscritos, y episodios disponibles en francés y alemán "en los próximos días y semanas".

Todos los podcasts traducidos estarán disponibles en el "Voice Translations Hub" de Spotify, que se actualizará con episodios y podcasts adicionales "en las próximas semanas y meses."

 

 

Avances con la IA

Otras empresas también dieron sus primeros pasos en el uso de la IA generativa para sus productos en los últimos meses.

Meta anunció a principios de año que lanzaría AudioCraft, una herramienta que permite a los usuarios crear música y sonidos generados por IA.

Google y Universal Music Group estaban aún en debate por conceder licencias de melodías y voces de artistas para música generada por IA.

Google asimismo confirmó a principios de este mes que había integrado su chatbot Bard en otras aplicaciones, como YouTube, Gmail y Drive. En medio de las preocupaciones sobre la privacidad y la seguridad, OpenAI dijo que estaba liberando gradualmente sus capacidades de imagen y voz para ChatGPT, después de que la compañía advirtiera que las nuevas características podrían presentar nuevos riesgos, que incluían "el potencial de que actores maliciosos se hagan pasar por figuras públicas o cometan fraude."

 

Esta nota habla de: