Tecnología

Cómo es Voice Engine, la nueva IA de OpenAI que clona tu voz con sólo escucharte una vez

OpenAI es una empresa líder en el campo de la inteligencia artificial, y además de su conocido ChatGPT y la innovadora tecnología de Sora, también desarrolló Voice Engine, una IA capaz de clonar tu voz con tan solo escucharte una vez durante 15 segundos.

Aunque aún se encuentra en fase de prueba, esta tecnología promete mucho. Voice Engine utiliza un fragmento de texto y una breve muestra de audio de 15 segundos para generar una voz con un sonido natural que se asemeja mucho a la del hablante original. La clave está en esa única muestra de 15 segundos, que, según OpenAI, puede generar voces emotivas y realistas.

Voice Engine fue desarrollado por OpenAI a finales de 2022 y fue utilizado para mejorar las voces predefinidas disponibles en la API de conversión de texto a voz, así como en aplicaciones como ChatGPT Voice y Read Aloud. Sin embargo, ahora es cuando comenzamos a ver los primeros resultados prometedores de esta tecnología.

Esta tecnología tiene un amplio campo de aplicación potencial, aunque por el momento OpenAI está probándola en una escala bastante limitada. La compañía menciona situaciones en las que Voice Engine podría ser de gran utilidad, como la traducción de contenido audiovisual, permitiendo a creadores y empresas llegar a una audiencia global de manera fluida y con sus propias voces.

Según OpenAI, cuando se utiliza para traducir contenido, Voice Engine conserva el acento nativo del hablante original. Por ejemplo, si se utiliza una muestra de audio de un hablante francés, el habla generada conservará el acento francés.

El acceso a Voice Engine está actualmente muy restringido debido a los posibles riesgos asociados con esta tecnología. OpenAI reconoce que generar voces que se asemejen a las de personas reales puede plantear serias preocupaciones éticas y legales. Por lo tanto, aquellos que tienen acceso a Voice Engine deben cumplir con estrictas medidas, como obtener el consentimiento explícito del hablante original y prohibir la suplantación de identidad sin autorización legal. Además, OpenAI no permite a los desarrolladores crear herramientas para que los usuarios individuales generen sus propias voces utilizando esta tecnología.

Artículos Relacionados