.webp&w=3840&q=95)
How we engineered RAG to be 50% faster
Tips from latency-sensitive RAG systems in production
Unser schnellstes Modell hat jetzt eine verbesserte Aussprache von Zahlen
Im November haben wir unser neues, schnellstes Modell vorgestellt, das Sprache erzeugt bei ≈400 ms Latenz (+ Netzwerklatenz) und ist vorbei doppelt so schnell wie unsere V1-Modelle.
Leider hatten Benutzer Schwierigkeiten, lange Zahlen auszusprechen. Hören Sie sich diese Generation von „Der aktuelle Aktienkurs von NVIDIA beträgt 867,49 $“ an:
Heute haben wir gerade eine verbesserte Aussprache von Zahlen für unser Turbo v2-Modell veröffentlicht. Hier ist die Aussprache nach der Änderung:
Vielen Dank an alle Benutzer, die uns durch ihr Feedback zu dieser Fehlerbehebung verholfen haben. Bitte teilen Sie uns auch weiterhin Bereiche mit, in denen unsere Modelle verbessert werden können.
Tips from latency-sensitive RAG systems in production
Eagr.ai transformed sales coaching by integrating ElevenLabs' conversational AI, replacing outdated role-playing with lifelike simulations. This led to a significant 18% average increase in win-rates and a 30% performance boost for top users, proving the power of realistic AI in corporate training.
Bereitgestellt von ElevenLabs Agenten