.webp&w=3840&q=95)
How we engineered RAG to be 50% faster
Tips from latency-sensitive RAG systems in production
Notre modèle le plus rapide a désormais une prononciation des nombres améliorée
En novembre, nous avons annoncé notre nouveau modèle, le plus rapide, qui génère la parole à ≈400 ms de latence (+ latence réseau) et c'est fini deux fois plus rapide comme nos modèles V1.
Malheureusement, les utilisateurs ont constaté qu'il était difficile de prononcer les nombres longs. Écoutez cette génération de « Le prix actuel de l'action NVIDIA est de 867,49 $ : »
Aujourd'hui, nous venons de publier une prononciation améliorée des chiffres pour notre modèle Turbo v2. Voici la prononciation après le changement :
Merci à tous les utilisateurs qui ont soumis des commentaires qui ont inspiré ce correctif - et n'hésitez pas à continuer à partager les domaines dans lesquels nos modèles peuvent être améliorés.
Tips from latency-sensitive RAG systems in production
Eagr.ai transformed sales coaching by integrating ElevenLabs' conversational AI, replacing outdated role-playing with lifelike simulations. This led to a significant 18% average increase in win-rates and a 30% performance boost for top users, proving the power of realistic AI in corporate training.
Propulsé par ElevenLabs Agents