.webp&w=3840&q=95)
How we engineered RAG to be 50% faster
Tips from latency-sensitive RAG systems in production
Nosso modelo mais rápido agora tem pronúncia de números aprimorada
Em novembro, anunciamos nosso novo modelo mais rápido que gera fala com latência de ≈400ms (+ latência de rede) e é mais de duas vezes mais rápido que nossos modelos V1.
Infelizmente, os usuários perceberam que ele tinha dificuldade em pronunciar números longos. Ouça esta geração de "O preço atual das ações da NVIDIA é $867,49.":
Hoje acabamos de lançar uma pronúncia de números aprimorada para nosso modelo Turbo v2. Aqui está a pronúncia após a mudança:
Obrigado a todos os usuários que enviaram feedback e inspiraram essa correção - e por favor, continuem compartilhando áreas onde nossos modelos podem ser melhorados.
Tips from latency-sensitive RAG systems in production
Eagr.ai transformed sales coaching by integrating ElevenLabs' conversational AI, replacing outdated role-playing with lifelike simulations. This led to a significant 18% average increase in win-rates and a 30% performance boost for top users, proving the power of realistic AI in corporate training.
Desenvolvido por ElevenLabs Agentes