.webp&w=3840&q=95)
How we engineered RAG to be 50% faster
Tips from latency-sensitive RAG systems in production
लंदन, यूकेलंदन, यूके - वैश्विक वॉइस AI सॉफ़्टवेयर के नेताElevenLabsने30 भाषाओं में 'भावनात्मक' AI आवाज़ें सटीकता से उत्पन्न करने में सक्षमएक नया मल्टीलिंगुअल वॉइस जनरेशन मॉडल पेश किया।
यह प्रगति पूरी तरह से इन-हाउस रिसर्च पर आधारित है, और अब क्रिएटर्स यूरोप, एशिया, मिडल ईस्ट के अंतरराष्ट्रीय बाजारों के लिए स्थानीयकृत वॉइस कंटेंट बना सकते हैं। ElevenLabs ने 18 महीनों तक मानव भाषण के मार्कर्स का विश्लेषण किया है, और संदर्भ की समझ और वॉइस जनरेशन में भावनात्मक अभिव्यक्ति के लिए नए तंत्र का निर्माण किया है।
Eleven Multilingual v2 का उपयोग करके, ElevenLabs टेक्स्ट टू स्पीच प्लेटफ़ॉर्म में टेक्स्ट डालने पर,नया मॉडल स्वचालित रूप से लगभग 30 लिखित भाषाओं को पहचानता है और अभूतपूर्व स्तर की विश्वसनीयता के साथ आवाज़ उत्पन्न करता है।
साथ ही, चाहे सिंथेटिक वॉइस हो या क्लोन वॉइस, सभी भाषाओं में वक्ता की अनोखी आवाज़ की विशेषताएं और विशिष्ट उच्चारण बनाए रहते हैं। इसका मतलब है कि आप एक ही आवाज़ का उपयोग करके 30 विभिन्न भाषाओं में कंटेंट को जीवंत बना सकते हैं।
इसरोलआउट के बाद, प्रोफेशनल वॉइस क्लोनिंग प्लेटफ़ॉर्म पर उपलब्ध कराई गई है। इस प्रोडक्ट अपडेट को अतिरिक्त सुरक्षा और सुरक्षा सुविधाओं के साथ जारी किया गया है, जिससे यूज़र्स अपनी आवाज़ की एक परफेक्ट डिजिटल कॉपी बना सकते हैं।
वास्तव में इसे मूल आवाज़ से अलग नहीं किया जा सकता। आज की रिलीज़ का मतलब है कि आप अपनी आवाज़ का उपयोग करके लगभग 30 भाषाओं में बात कर सकते हैं जो मल्टीलिंगुअल मॉडल प्रदान करता है।
समर्थित भाषाएँ: कोरियाई, डच, तुर्की, स्वीडिश, इंडोनेशियाई, वियतनामी, फिलिपिनो, यूक्रेनी, ग्रीक, चेक, फिनिश, रोमानियाई, डेनिश, बुल्गारियाई, मलय, हंगेरियन, नॉर्वेजियन, स्लोवाक, क्रोएशियाई, क्लासिकल अरबी, तमिल। ये अंग्रेजी, पोलिश, जर्मन, स्पेनिश, फ्रेंच, इटालियन, हिंदी, पुर्तगाली आदि पहले से उपलब्ध भाषाओं में शामिल हो गए हैं।
हाल की फीचर रिलीज़ और प्लेटफ़ॉर्म के निरंतर सुधार के बाद, ElevenLabs आज घोषणा करता है कि प्लेटफ़ॉर्म आधिकारिक रूप से बीटा से बाहर हो गया है। यह परिवर्तन 10 लाख से अधिक वैश्विक यूज़र्स को विश्वसनीय और अत्याधुनिक टूल्स प्रदान करने की कंपनी की प्रतिबद्धता का एक महत्वपूर्ण क्षण है।
आगे चलकर ElevenLabs यूज़र्स को प्लेटफ़ॉर्म पर आवाज़ साझा करने, नए ऑडियो के विकास से लाभ उठाने और मानव और AI के सहयोग के अवसरों को बढ़ावा देने के लिए तंत्र पेश करेगा।
ElevenLabs के सीईओ और सह-संस्थापक Mati Staniszewski ने कहा:
“ElevenLabsहर भाषा और आवाज़ में सभी कंटेंट को सार्वभौमिक रूप से सुलभ बनाने के सपने से शुरू हुआ। Eleven Multilingual v2की रिलीज़ के साथ, हमने इस सपने को साकार किया और सभी बोलियों में मानव गुणवत्ता कीAIआवाज़ के उपयोग के करीब एक कदम बढ़ाया।
“टेक्स्ट टू स्पीच जनरेशन टूल्स प्रतिस्पर्धा के मैदान को बराबर करते हैं और सभी क्रिएटर्स को उच्च गुणवत्ता वाली वॉइस ऑडियो सुविधाएं प्रदान करते हैं। ये लाभ अब लगभग30भाषाओं में मल्टीलिंगुअल एप्लिकेशन में विस्तारित हो रहे हैं। अंततः,AIकी मदद से, हम और अधिक भाषाओं और आवाज़ों को कवर करना चाहते हैं और कंटेंट के लिए भाषाई बाधाओं को समाप्त करना चाहते हैं। ElevenLabsमें, हम मानते हैं कि ये एक्सेसिबिलिटी की छलांग अंततः रचनात्मकता, नवाचार और विविधता को बढ़ावा देगी।”
ElevenLabs कंपनियों और क्रिएटर्स को कई भाषाओं में उच्च गुणवत्ता वाले ऑडियो कंटेंट बनाने के लिए आवश्यक लागत और संसाधनों को कम करके, कई संस्कृतियों और भाषाओं में गूंजने वाले अधिक कल्पनाशील और सुलभ कंटेंट बनाने में सक्षम बनाता है।
स्वतंत्र गेम डेवलपर्स और पब्लिशर्सके लिए, मल्टीलिंगुअल वॉइस जनरेशन टूल्स बिना आवाज़ की गुणवत्ता या सटीकता को प्रभावित किए, खिलाड़ियों और श्रोताओं की भाषा में जुड़ने और अंतरराष्ट्रीय दर्शकों के लिए गेम अनुभव और वॉइस कंटेंट का अनुवाद करने के नए अवसर प्रदान करते हैं।
इसी तरह, शैक्षणिक संस्थानसीखने वालों को लक्षित भाषा में सटीक ऑडियो कंटेंट तुरंत प्रदान कर सकते हैं, भाषा समझ और उच्चारण कौशल को मजबूत कर सकते हैं, और विभिन्न शिक्षण शैलियों और अंतरराष्ट्रीय छात्रों की सीखने की जरूरतों को पूरा करने के साधन प्राप्त कर सकते हैं।
सभी प्रकार के क्रिएटर्स ElevenLabs के टूल्स का उपयोग करके, कई भाषाओं में उपलब्ध आवाज़ के साथ दृश्य कंटेंट को पूरक कर सकते हैं, जिससे दृष्टिबाधित या सीखने की जरूरतों वाले लोगों के लिए कंटेंट कीसुलभताको बढ़ाया जा सकता है।
जनवरी 2023 में जारी किए गए पहले AI वॉइस टूल्स सूट में विभिन्न पूर्वनिर्धारित सिंथेटिक आवाज़ें और आपकी खुद की आवाज़ का क्लोन बनाने की क्षमता शामिल थी। मल्टीलिंगुअल वॉइस टूल्स ElevenLabs के मिशन का अगला चरण है, जो सभी कंटेंट को सभी भाषाओं और सभी आवाज़ों में सार्वभौमिक रूप से सुलभ बनाता है।
यह तकनीक पहले से ही विभिन्न रचनात्मक वर्टिकल और सेक्टरों में अपनाई जा चुकी है, जैसे कि इंडी लेखकों द्वारा ऑडियोबुक का निर्माण, वीडियो गेम में सेकेंडरी कैरेक्टर की आवाज़, दृष्टिबाधित लोगों के लिए ऑनलाइन लिखित कंटेंट तक पहुंच के लिए समर्थन, और दुनिया के पहले AI रेडियो चैनल की प्रेरणा। ElevenLabs ने AI वीडियो जनरेटरD-IDके साथ साझेदारी की है, जो दुनिया के सबसे बड़े ऑडियोबुक पब्लिशर्स में से एक हैStorytel,ओपन एक्सेस साइंस वीडियो प्लेटफ़ॉर्मScienceCast जो वीडियो जनरेशन टूल्स का उपयोग करता हैarXiv पर प्रकाशित वैज्ञानिक शोध पत्रों को संक्षेप में प्रस्तुत करने के लिए,दुनिया के अग्रणी कंटेंट क्रिएटर प्लेटफ़ॉर्मTheSoul Publishing, Embark Studios औरParadox Interactiveजैसे शानदार गेम डेवलपर्स, और मीडिया प्लेटफ़ॉर्मMNTNआदि के साथ विभिन्न शीर्ष कंटेंट निर्माताओं, स्टूडियो के साथ साझेदारी की है।
Tips from latency-sensitive RAG systems in production
Eagr.ai transformed sales coaching by integrating ElevenLabs' conversational AI, replacing outdated role-playing with lifelike simulations. This led to a significant 18% average increase in win-rates and a 30% performance boost for top users, proving the power of realistic AI in corporate training.
ElevenLabs द्वारा संचालित एजेंट्स