
प्रत्येक वक्ता की भावना, समय, टोन और विशेषताओं को बनाए रखते हुए ऑडियो और वीडियो का अनुवाद करें
यह वॉइस ट्रांसलेशन टूल कुछ ही मिनटों में बोले गए कंटेंट को दूसरी भाषा में बदल सकता है, जबकि मूल वक्ता की आवाज़ को बनाए रखता है।
10 अक्टूबर, वैश्विक - ElevenLabs, वॉइस AI टेक्नोलॉजी में वैश्विक नेता, आज एक क्रांतिकारी वॉइस ट्रांसलेशन फीचर को अपने प्लेटफ़ॉर्म में जोड़ने की घोषणा करता है। ElevenLabs की स्थापना के समय से ही सामग्री की भाषाई बाधाओं को समाप्त करने के मूल मिशन से उत्पन्न, और कंपनी के अब तक के शोध का परिणाम, AI डबिंग टूल यूज़र्स को किसी भी स्पीच को दूसरी भाषा में स्वचालित रूप से अनुवाद करने में सक्षम बनाता है, जबकि मूल वक्ता की आवाज़ को बनाए रखता है - ऑडियो और वीडियो सामग्री को डब करने का एक नया, उच्च गुणवत्ता और प्रभावी तरीका।
प्रत्येक वक्ता की भावना, समय, टोन और विशेषताओं को बनाए रखते हुए ऑडियो और वीडियो का अनुवाद करें
ElevenLabs के सीईओ और सह-संस्थापक, माटी स्टानिस्ज़ेव्स्की, कहते हैं:
“AI डबिंग का रिलीज़ हमारी सामग्री की भाषाई बाधाओं को समाप्त करने की दिशा में अब तक का सबसे बड़ा कदम है। यह दर्शकों को किसी भी भाषा में सामग्री का आनंद लेने में मदद करेगा। और इसका मतलब है कि कंटेंट क्रिएटर्स आसानी से और प्रामाणिक रूप से दुनिया भर में एक बड़े दर्शक वर्ग तक पहुंच सकते हैं। इन भाषाई बाधाओं का खुद अनुभव करने के बाद, मेरे सह-संस्थापक पियोटर और मैं AI डबिंग को जीवन में लाने के लिए बहुत उत्साहित हैं।”
स्ट्रीमिंग, गेमिंग और फिल्मों जैसे माध्यमों में सामग्री की पहुंच में एक नए युग का संकेत देते हुए, नया टूल पारंपरिक अनुवाद और कैप्शनिंग से आगे बढ़ता है, अनुवादित होने पर वक्ता की पहचान और मूल भाषण पैटर्न को बनाए रखता है। इसका मतलब है कि वही अभिनेता की आवाज़ 20 से अधिक विभिन्न भाषाओं में दर्शकों द्वारा सुनी जा सकती है, मूल रिकॉर्डिंग की विशेषताओं और बारीकियों के साथ।
AI Dubbing कंपनी के बहुभाषी भाषण संश्लेषण, वॉइस क्लोनिंग, टेक्स्ट और ऑडियो प्रोसेसिंग पर शोध को एक ही टूल में जोड़ता है; अनुवादित सामग्री की प्रामाणिकता को बढ़ाता है और इसे व्यापक दर्शकों के लिए अधिक सुलभ बनाता है, जबकि मूल प्रस्तुति का सार बनाए रखता है। AI डबिंग फीचर 20 से अधिक भाषाओं में वॉइस ट्रांसलेशन का समर्थन करता है, जो वर्तमान में Eleven Multilingual v2 मॉडल द्वारा समर्थित हैं, जिनमें हिंदी, पुर्तगाली, स्पेनिश, जापानी, यूक्रेनी, पोलिश या अरबी शामिल हैं।
यह कदम ElevenLabs के ऑडियो AI क्षेत्र में शोध को और बढ़ाता है; मूल ऑडियो से भावनाओं और स्वर को डब किए गए ऑडियो में बदलने में सक्षम बनाता है। कंपनी ने विभिन्न वक्ताओं की आवाज़ों का पता लगाने और बैकग्राउंड शोर को हटाने के अपने तरीके भी विकसित किए हैं, संगीत और शोर को संवाद से अलग करते हुए। इसका मतलब है कि टूल कई वक्ताओं वाले ऑडियो या वीडियो को प्रभावी ढंग से संभाल सकता है, यह सुनिश्चित करते हुए कि प्रत्येक आवाज़ विभिन्न भाषाओं में अलग और पहचानने योग्य बनी रहे।
डबिंग प्रक्रिया को स्वचालित करके और उच्च गुणवत्ता वाले आउटपुट को सुनिश्चित करके, ElevenLabs क्रिएटर्स, शिक्षकों और मीडिया कंपनियों के लिए बहुभाषी सामग्री का निर्माण सरल बनाता है। दुनिया की केवल 6% आबादी ही मूल अंग्रेजी बोलने वाली है और 75% कोई अंग्रेजी नहीं बोलते। इस रिलीज़ का मतलब है कि अब हर वीडियो को वैश्विक दर्शकों के लिए उपलब्ध कराया जा सकता है, वह भी तेज़ी से और कम लागत पर।
यह घोषणा हाल ही में जारी स्टूडियो - ElevenLabs का उन्नत वर्कफ़्लो है जो लंबे फॉर्मेट के ऑडियो को उत्पन्न और संपादित करने के लिए है, जिसमें स्पीकर असाइनमेंट, पॉज़ इंसर्शन और सेगमेंट पुनर्जनन जैसी विभिन्न संपादन सुविधाओं का समर्थन करता है।
इस जोड़ के साथ, ElevenLabs अपनी भाषा बाधाओं को तोड़ने और किसी भी भाषा और आवाज़ में सामग्री को सार्वभौमिक रूप से सुलभ बनाने के मिशन को जारी रखता है।
प्रत्येक वक्ता की भावना, समय, टोन और विशेषताओं को बनाए रखते हुए ऑडियो और वीडियो का अनुवाद करें
Tips from latency-sensitive RAG systems in production
Eagr.ai transformed sales coaching by integrating ElevenLabs' conversational AI, replacing outdated role-playing with lifelike simulations. This led to a significant 18% average increase in win-rates and a 30% performance boost for top users, proving the power of realistic AI in corporate training.
ElevenLabs द्वारा संचालित एजेंट्स