.webp&w=3840&q=95)
How we engineered RAG to be 50% faster
Tips from latency-sensitive RAG systems in production
इस प्रगति से दुनिया भर की मीडिया कंपनियों, गेम डेवलपर्स, प्रकाशकों और स्वतंत्र रचनाकारों को अपनी विषय-वस्तु की पहुंच में नाटकीय रूप से सुधार करने में मदद मिलेगी।
ElevenLabsवॉयस एआई सॉफ्टवेयर में विश्व-अग्रणी, ने आज एक नया बहुभाषी वॉयस जेनरेशन मॉडल लॉन्च किया है लगभग 30 भाषाओं में 'भावनात्मक रूप से समृद्ध' एआई ऑडियो का सटीक रूप से उत्पादन करने में सक्षम।
यह प्रगति, जो पूर्णतः आंतरिक अनुसंधान पर आधारित है, रचनाकारों को यूरोप, एशिया और मध्य पूर्व के अंतर्राष्ट्रीय बाजारों के लिए स्थानीयकृत ऑडियो सामग्री तैयार करने में सक्षम बनाएगी। इलेवनलैब्स ने पिछले 18 महीने मानव वाणी के संकेतों का विश्लेषण करने, वाणी निर्माण में संदर्भ को समझने और भावनाओं को व्यक्त करने के लिए नए तंत्रों का निर्माण करने, साथ ही नई, अनूठी आवाजों को संश्लेषित करने में बिताए हैं।
Eleven Multilingual v2 के साथ, जब ElevenLabs में टेक्स्ट इनपुट किया जाता है टेक्स्ट टू स्पीच प्लैटफ़ॉर्म, नया मॉडल स्वचालित रूप से लगभग 30 लिखित भाषाओं की पहचान कर सकता है और उनमें अभूतपूर्व स्तर की प्रामाणिकता के साथ भाषण उत्पन्न कर सकता है।
साथ ही, चाहे कृत्रिम आवाज या क्लोन आवाज का उपयोग किया जा रहा हो, वक्ता की अद्वितीय आवाज विशेषताओं को सभी भाषाओं में बनाए रखा जाता है, जिसमें उनका मूल उच्चारण भी शामिल है। इसका मतलब यह है कि एक ही आवाज का उपयोग 28 अलग-अलग भाषाओं में सामग्री को जीवंत बनाने के लिए किया जा सकता है।
यह रोल-आउट इस प्रकार है की सार्वजनिक रिलीज चार सप्ताह की प्रतीक्षा अवधि की ज़रूरत होती है, मंच पर सभी रचनाकारों के लिए। यह उत्पाद अद्यतन, जो अतिरिक्त सुरक्षा सुविधाओं के साथ उपलब्ध कराया गया है, उपयोगकर्ताओं को अपनी आवाज की एक आदर्श डिजिटल प्रतिलिपि बनाने की अनुमति देता है; जो मूल से लगभग अप्रभेद्य होगी। आज की रिलीज का मतलब है कि आपकी आवाज बहुभाषी मॉडल द्वारा पेश की गई लगभग 30 भाषाओं में बोलने में सक्षम होगी।
अब समर्थित भाषाओं में शामिल हैं; चीनी, कोरियाई, डच, तुर्की, स्वीडिश, इन्डोनेशियाई, filipino, जापानी, यूक्रेनी, यूनानी, चेक, फिनिश, रोमानियाई, डेनिश, बल्गेरियाई, मलायी, स्लोवाक, क्रोएशियाई, क्लासिक अरबी , और तामिल।
वे पहले से उपलब्ध भाषाओं में शामिल हो गए शामिल अंग्रेज़ी, पोलिश, जर्मन, स्पैनिश, फ्रेंच, इतालवी, हिन्दी , और पुर्तगाली।
हाल ही में फीचर लॉन्च और प्लेटफॉर्म पर चल रहे सुधारों के बाद, इलेवनलैब्स ने आज यह भी पुष्टि की है कि प्लेटफॉर्म आधिकारिक तौर पर बीटा से बाहर आ रहा है। यह परिवर्तन कंपनी के अपने 1 मिलियन से अधिक वैश्विक उपयोगकर्ताओं के लिए विश्वसनीय और अत्याधुनिक उपकरण प्रदान करने के समर्पण में एक महत्वपूर्ण क्षण है।
भविष्य को देखते हुए, इलेवनलैब्स एक ऐसी प्रणाली शुरू करने की योजना बना रही है जो उपयोगकर्ताओं को प्लेटफॉर्म पर आवाज साझा करने और नए ऑडियो के विकास से लाभान्वित करने की अनुमति दे, जिससे मानव-एआई सहयोग के अवसरों को बढ़ावा मिले।
इलेवनलैब्स के सीईओ और सह-संस्थापक मती स्टेनिसजेव्स्की ने कहा:
इलेवनलैब्स की शुरुआत इस सपने के साथ की गई थी कि सभी सामग्री को किसी भी भाषा और किसी भी आवाज में सार्वभौमिक रूप से सुलभ बनाया जाए। इलेवन मल्टीलिंगुअल v2 के रिलीज के साथ, हम इस सपने को वास्तविकता बनाने और हर बोली में मानव-गुणवत्ता वाली AI आवाजें उपलब्ध कराने के एक कदम और करीब आ गए हैं।
"हमारे टेक्स्ट-टू-स्पीच जेनरेशन टूल सभी रचनाकारों को समान अवसर प्रदान करने तथा उच्च गुणवत्ता वाली मौखिक ऑडियो क्षमताएं उपलब्ध कराने में मदद करते हैं। ये लाभ अब लगभग 30 भाषाओं में बहुभाषी अनुप्रयोगों तक विस्तारित हो गए हैं। अंततः हम आशा करते हैं कि हम एआई की सहायता से और भी अधिक भाषाओं और आवाजों को कवर कर सकेंगे, तथा विषय-वस्तु में भाषाई बाधाओं को समाप्त कर सकेंगे। इलेवनलैब्स में, हमारा मानना है कि सुलभता में ये उछाल अंततः अधिक रचनात्मकता, नवाचार और विविधता को बढ़ावा देगा।
विभिन्न भाषाओं में उच्च गुणवत्ता वाली ऑडियो सामग्री बनाने के लिए आवश्यक लागत और संसाधनों को कम करके, इलेवनलैब्स कम्पनियों और रचनाकारों को अधिक कल्पनाशील और सुलभ सामग्री बनाने में सक्षम बना रहा है, जो विभिन्न संस्कृतियों और भाषाओं में प्रतिध्वनित होती है।
प्रोफ़ेशनल वॉइस क्लोनिंग के लिए लगभग स्वतंत्र खेल डेवलपर्स और प्रकाशकबहुभाषी भाषण सृजन उपकरण, अंतर्राष्ट्रीय दर्शकों के लिए खेल के अनुभवों और ऑडियो सामग्री का अनुवाद करने के नए अवसर प्रदान करता है, तथा बोले गए ऑडियो की गुणवत्ता या सटीकता से समझौता किए बिना खिलाड़ियों और श्रोताओं से उनकी अपनी भाषा में जुड़ता है।
इसी प्रकार, शिक्षण संस्थानों अब हमारे पास शिक्षार्थियों को लक्षित भाषाओं में सटीक ऑडियो सामग्री तुरन्त उपलब्ध कराने, भाषा समझ और उच्चारण कौशल को बढ़ाने, साथ ही अंतर्राष्ट्रीय छात्रों के लिए विभिन्न शिक्षण शैलियों और सीखने की आवश्यकताओं को पूरा करने का साधन है।
सभी प्रकार के क्रिएटर अपनी सामग्री को बेहतर बनाने के लिए ElevenLabs के टूल का उपयोग कर सकते हैं एक्सेसिबिलिटी दृश्य-बाधित या अतिरिक्त शिक्षण आवश्यकताओं वाले लोगों के लिए दृश्य सामग्री के साथ-साथ अनेक भाषाओं में उपलब्ध भाषण भी उपलब्ध कराया जाएगा।
जनवरी 2023 में अनावरण किए गए इसके एआई वॉयस टूल्स के प्रारंभिक सूट में पूर्व-डिज़ाइन किए गए, सिंथेटिक आवाज़ों के चयन के माध्यम से किसी भी पाठ को भाषण में बदलने की क्षमता और अपनी खुद की आवाज़ का क्लोन बनाने की क्षमता शामिल थी। बहुभाषी वाक् संश्लेषण उपकरण, सभी विषय-वस्तु को किसी भी भाषा और किसी भी आवाज में सार्वभौमिक रूप से सुलभ बनाने के इलेवनलैब्स के मिशन की दिशा में एक और कदम है।
इस प्रौद्योगिकी को पहले ही अनेक रचनात्मक क्षेत्रों और कार्यक्षेत्रों में अपनाया जा चुका है, जिसमें स्वतंत्र लेखकों को ऑडियो पुस्तकें बनाने में सक्षम बनाना, वीडियो गेम में द्वितीयक पात्रों को आवाज देना, दृष्टिबाधित लोगों को ऑनलाइन लिखित सामग्री तक पहुंच प्रदान करना, तथा विश्व के प्रथम एआई रेडियो चैनल को सशक्त बनाना शामिल है। इलेवनलैब्स ने कई प्रमुख कंटेंट क्रिएटर्स और स्टूडियो के साथ साझेदारी की है, जिसमें एआई वीडियो जनरेटर भी शामिल हैं किया, दुनिया के सबसे बड़े ऑडियोबुक प्रकाशकों में से एक स्टोरीटेल, ओपन-एक्सेस विज्ञान वीडियो प्लेटफ़ॉर्म साइंसकास्ट जिसका वीडियो निर्माण उपकरण प्रकाशित वैज्ञानिक शोध पत्रों को संक्षिप्त करता है एआरएक्सिव, अग्रणी वैश्विक सामग्री निर्माता मंच द सोल पब्लिशिंग, अविश्वसनीय खेल डेवलपर्स की तरह एम्बार्क स्टूडियोज़ , और पैराडॉक्स इंटरएक्टिव, और मीडिया प्लेटफॉर्म एमएनटीएन.
Tips from latency-sensitive RAG systems in production
Eagr.ai transformed sales coaching by integrating ElevenLabs' conversational AI, replacing outdated role-playing with lifelike simulations. This led to a significant 18% average increase in win-rates and a 30% performance boost for top users, proving the power of realistic AI in corporate training.
ElevenLabs द्वारा संचालित एजेंट्स