
फ्लैश से मिलिए
आपने कभी भी इतनी तेजी से मानव-जैसी TTS का अनुभव नहीं किया होगा
दुनिया के सबसे सटीक ASR मॉडल के साथ स्पीच को टेक्स्ट में ट्रांसक्राइब करें
Scribe, हमारा पहला स्पीच टू टेक्स्टमॉडल, दुनिया का सबसे सटीक ट्रांसक्रिप्शन मॉडल है। वास्तविक दुनिया के ऑडियो की अनिश्चितता को संभालने के लिए बनाया गया, Scribe 99 भाषाओं में स्पीच को ट्रांसक्राइब करता है, जिसमें शब्द-स्तरीय टाइमस्टैम्प, स्पीकर डायराइजेशन, और ऑडियो-इवेंट टैगिंग शामिल हैं—यह सब एक संरचित प्रतिक्रिया में दिया जाता है ताकि इसे आसानी से इंटीग्रेट किया जा सके।
Scribe को सटीकता के लिए डिज़ाइन किया गया है। 99 भाषाओं में FLEURS और Common Voice बेंचमार्क टेस्ट में, यह लगातार Gemini 2.0 Flash, Whisper Large V3 और Deepgram Nova-3 जैसे प्रमुख मॉडलों से बेहतर प्रदर्शन करता है। चाहे वह मीटिंग सारांश हो, मूवी सबटाइटल्स हों, या गाने के बोल, Scribe इटालियन (98.7%), अंग्रेजी (96.7%) और 97 अन्य भाषाओं में सबसे कम स्वचालित ट्रांसक्रिप्शन शब्द त्रुटि दर प्रदान करता है।
Scribe ASR को सार्वभौमिक रूप से सुलभ बनाता है—पारंपरिक रूप से कम सेवा प्राप्त भाषाओं जैसे सर्बियन, कैंटोनीज़, और मलयालम में त्रुटियों को नाटकीय रूप से कम करता है, जहां प्रतिस्पर्धी मॉडल अक्सर 40% शब्द त्रुटि दर से अधिक होते हैं।
डेवलपर्स आज ही Scribe को हमारे स्पीच टू टेक्स्ट API के माध्यम से इंटीग्रेट कर सकते हैं ताकि स्पीकर डायराइजेशन और शब्द-स्तरीय टाइमस्टैम्प्स और गैर-भाषण इवेंट मार्कर्स (जैसे हंसी) के साथ संरचित JSON ट्रांसक्रिप्ट्स प्राप्त कर सकें। रियल-टाइम एप्लिकेशन्स के लिए एक लो-लेटेंसी संस्करण जल्द ही जारी किया जाएगा।
क्रिएटर्स और व्यवसाय Scribe का सीधे ElevenLabs डैशबोर्ड के माध्यम से उपयोग कर सकते हैं ताकि ऑडियो या वीडियो फाइल्स अपलोड कर सकें और फॉर्मेटेड ट्रांसक्रिप्ट्स जनरेट कर सकें।
Scribe के साथ निर्माण शुरू करें:
API डॉक्यूमेंटेशन | ElevenLabs डैशबोर्ड में आजमाएं
अनुसंधान नेतृत्व, प्रशिक्षण, आर्किटेक्चर
फ्लावियो श्नाइडर
प्रोजेक्ट नेतृत्व, प्री-ट्रेनिंग डेटा, फाइन-ट्यूनिंग डेटा
टिम वॉन केनेल
इन्फरेंस, ऑप्टिमाइजेशन
मैक्सिमिलियानो लेवी
अनुसंधान योगदानकर्ता
जोहान नॉर्डबर्ग, पिओत्र डाबकोव्स्की
फ्रंटएंड
ऑस्टिन मलेर्बा
बैकएंड
ह्रिस्तो स्टोयचेव
डेटा अधिग्रहण
एलेक्स जॉर्ज
आपने कभी भी इतनी तेजी से मानव-जैसी TTS का अनुभव नहीं किया होगा
हमारा ऑल इन वन प्लेटफॉर्म जो कस्टमाइज़ेबल, इंटरैक्टिव वॉइस एजेंट्स बनाने के लिए है
ElevenLabs द्वारा संचालित एजेंट्स