Síntesis de Voz 2.0

¡Con esta actualización, la síntesis de voz será aún mejor! Hemos realizado cambios en cómo entrenamos el modelo, obteniendo mejores resultados en fragmentos más largos. Puedes ir al panel habitual para probarlo de inmediato. Nuestros cambios principales incluyen:

  • Soporte para entrada con mayúsculas, lo que facilita al modelo leer nombres (como OpenAI o ChatGPT) y construir pausas entre fragmentos o nombres
  • Entrenamiento más largo y mejor: el modelo parece rendir mejor en nuestros benchmarks de formato largo y en las funciones de pérdida
  • Componentes necesarios para soportar el relleno: cambios contextuales en fragmentos
  • Componentes necesarios para extender el modelo a través de idiomas en la misma plataforma

Se espera que tus Voces clonadas o predeterminadas resulten en cambios menores. ¡Disfruta!

Descubre artículos del equipo de ElevenLabs

Customer stories
eagr_case study

Eagr.ai Supercharges Sales Training with ElevenLabs' Conversational AI Agents

Eagr.ai transformed sales coaching by integrating ElevenLabs' conversational AI, replacing outdated role-playing with lifelike simulations. This led to a significant 18% average increase in win-rates and a 30% performance boost for top users, proving the power of realistic AI in corporate training.

ElevenLabs

Crea con audio con IA de la más alta calidad

Empieza gratis

¿Ya tienes una cuenta? Inicia sesión