Pronúncia de números no Turbo v2

21 de mar. de 2024 • 2 minutos de leitura

Nosso modelo mais rápido agora tem pronúncia de números aprimorada

Em novembro, anunciamos nosso novo modelo mais rápido que gera fala com latência de ≈400ms (+ latência de rede) e é mais de duas vezes mais rápido que nossos modelos V1.

Infelizmente, os usuários perceberam que ele tinha dificuldade em pronunciar números longos. Ouça esta geração de "O preço atual das ações da NVIDIA é $867,49.":

00:00 / 00:00

Hoje acabamos de lançar uma pronúncia de números aprimorada para nosso modelo Turbo v2. Aqui está a pronúncia após a mudança:

00:00 / 00:00

Obrigado a todos os usuários que enviaram feedback e inspiraram essa correção - e por favor, continuem compartilhando áreas onde nossos modelos podem ser melhorados.

Explore artigos da equipe ElevenLabs

Product

Product

How we engineered RAG to be 50% faster

Tips from latency-sensitive RAG systems in production

Customer stories

Customer stories

Eagr.ai Supercharges Sales Training with ElevenLabs' Conversational AI Agents

Eagr.ai transformed sales coaching by integrating ElevenLabs' conversational AI, replacing outdated role-playing with lifelike simulations. This led to a significant 18% average increase in win-rates and a 30% performance boost for top users, proving the power of realistic AI in corporate training.

Crie com o áudio IA da mais alta qualidade

Comece agora - é grátis

Já tem uma conta? Entrar