Eleven v3 ऑडियो टैग्स: स्पीच में कैरेक्टर परफॉर्मेंस को निर्देशित करना

प्राकृतिक बातचीत के लिए टोन, भावना, और गति को नियंत्रित करें। अपने टेक्स्ट टू स्पीच में कैरेक्टर परफॉर्मेंस जोड़ें।

v3

ऑडियो टैग्स Eleven v3 (अल्फा) में एक शक्तिशाली टूल हैं, जो ElevenLabs का नया रिसर्च प्रीव्यू टेक्स्ट टू स्पीच मॉडल है। ये तत्व न केवल टोन और गति बल्कि कैरेक्टर और वोकल परफॉर्मेंस पर सटीक दिशा निर्देश देते हैं।

[पाइरेट वॉइस], [फ्रेंच एक्सेंट], या [व्यंग्यात्मक] जैसे टैग्स के साथ, वॉइस केवल वर्णन नहीं बल्कि कहानी कहने का एक उपकरण बन जाती है। एक मजबूत कैरेक्टर वॉइस क्लोन के साथ, आप केवल ध्वनि ही नहीं, बल्कि एक पूरी परफॉर्मेंस को कैप्चर कर सकते हैं।

ये टैग्स वोकल आइडेंटिटी को मिड-लाइन में बदलने, एक्सेंट्स की नकल करने, या खलनायक, कथाकार, या सहायक पात्र जैसे आर्केटाइप्स में झुकने की अनुमति देते हैं — बिना मूल स्क्रिप्ट को बदले या अलग वॉइस में स्विच किए।

AI स्पीच में कैरेक्टर परफॉर्मेंस क्या है?

कैरेक्टर परफॉर्मेंस एक भूमिका में कदम रखने की क्षमता है। चाहे आप एक रंगीन खलनायक, एक कठोर समुद्री कप्तान, या मेलबर्न के एक स्थानीय दुकानदार की आवाज़ दे रहे हों, नए ऑडियो टैग्स आपको उस व्यक्तित्व के अनुरूप डिलीवरी को निर्देशित करने देते हैं जिसे आप व्यक्त करना चाहते हैं।

एक साधारण ब्रैकेटेड वाक्यांश के साथ, आप दृश्य सेट कर सकते हैं: “[पाइरेट वॉइस] अरे, खुला समुद्र। इसे सूंघो, दोस्तों? यह स्वतंत्रता की खुशबू है... और बस विद्रोह की एक झलक।”

मॉडल केवल शब्दों का उच्चारण नहीं करता — यह उन्हें कैरेक्टर में परफॉर्म करता है।

एक्सेंट से आर्केटाइप तक

Background

वॉइस परफॉर्मेंस केवल वॉल्यूम या भावना के बारे में नहीं है। यह भी महत्वपूर्ण है कि कौन बोल रहा है। Eleven v3 के साथ, आप तुरंत विशिष्ट एक्सेंट्स, बोलियों, और बोलने की शैलियों को संकेत दे सकते हैं। उदाहरण के लिए:

[अमेरिकन एक्सेंट] क्या आप पुराने मॉडल में मेरा एक्सेंट बदल सकते थे? [उपेक्षात्मक] नहीं लगता। [ऑस्ट्रेलियन एक्सेंट] लेकिन अब आप कर सकते हैं — इसे देखें, दोस्त! [फ्रेंच एक्सेंट] मेरा प्यार... लाल, लाल गुलाब की तरह है।

इस तरह की तरल पहचान-स्विचिंग एनीमेशन, गेम्स, इंटरैक्टिव फिक्शन, या किसी भी क्षण के लिए आदर्श है जहां वक्ता की व्यक्तित्व महत्वपूर्ण है।

कैरेक्टर परफॉर्मेंस के लिए सामान्य टैग्स

कैरेक्टर-केंद्रित टैग्स आपको वोकल आइडेंटिटी और उपस्थिति को आकार देने की अनुमति देते हैं:

  • एक्सेंट्स और बोलियाँ: [ब्रिटिश एक्सेंट], [ऑस्ट्रेलियन एक्सेंट], [सदर्न यूएस एक्सेंट]
  • आर्केटाइप्स और भूमिकाएँ: [पाइरेट वॉइस], [ईविल साइंटिस्ट वॉइस], [बालसुलभ टोन]
  • स्पीच शैलियाँ: [नाटकीय], [व्यंग्यात्मक], [तथ्यात्मक], [रूआंसी]
  • शैली संकेत: [फैंटेसी कथाकार], [साइ-फाई AI वॉइस], [क्लासिक फिल्म नोयर]

टैग्स की लेयरिंग से कैरेक्टर्स को जीवंत बनाने में मदद मिलती है: “[नाटकीय][फ्रेंच एक्सेंट] आप नहीं समझते... यह कभी बदले के बारे में नहीं था। यह नियति के बारे में था।”

कथाकार से लेकर एन्सेम्बल कास्ट तक

मल्टी-कैरेक्टर स्क्रिप्ट्स में, ऑडियो टैग्स के साथ आवाज़ों के बीच स्विच करना आसान हो जाता है। केवल कैरेक्टर परफॉर्मेंस को मिड-डायलॉग में स्विच करके तनाव, हास्य, या आश्चर्य जोड़ें — कोई अतिरिक्त संपादन की आवश्यकता नहीं।

Background

डेमो से यह अंश लें: "जेसिका: [हंसते हुए] वह... सुंदर था। डॉ. वॉन फ्यूजन: [नाटकीय] होना या न होना — यही सवाल है! जेसिका: [फ्रेंच एक्सेंट] यह शानदार है, है ना?"

जो पहले एक पूर्ण कास्ट की आवश्यकता होती थी, अब एक ही वॉइस ट्रैक में स्क्रिप्ट किया जा सकता है — बिना रेंज या गहराई को खोए।

केवल लाइनों को लिखना नहीं, बल्कि आवाज़ों को निर्देशित करना

Eleven v3 डायनामिक वोकल बदलाव, संदर्भीय शिफ्ट्स, और कैरेक्टर्स के बीच लगातार डिलीवरी का समर्थन करता है। इसका मतलब है कि मॉडल न केवल समझता है क्या कहना है — बल्कि कैसे प्रत्येक कैरेक्टर को इसे कहना चाहिए।

क्रिएटर्स के लिए, यह नियंत्रण का एक नया आयाम खोलता है। आप केवल संवाद नहीं लिख रहे हैं। आप परफॉर्मेंस को निर्देशित कर रहे हैं।

सही आवाज़ का चयन करना

प्रोफेशनल वॉइस क्लोन्स (PVCs) वर्तमान में Eleven v3 के लिए पूरी तरह से अनुकूलित नहीं हैं, जिसके परिणामस्वरूप पहले के मॉडलों की तुलना में क्लोन गुणवत्ता कम हो सकती है। इस रिसर्च प्रीव्यू चरण के दौरान, यदि आपको v3 फीचर्स का उपयोग करना है, तो अपने प्रोजेक्ट के लिए एक इंस्टेंट वॉइस क्लोन (IVC) या डिज़ाइन की गई आवाज़ ढूंढना सबसे अच्छा होगा। PVC का v3 के लिए अनुकूलन निकट भविष्य में आ रहा है।

ElevenLabs टीम के लेखों को देखें

Customer stories
eagr_case study

Eagr.ai Supercharges Sales Training with ElevenLabs' Conversational AI Agents

Eagr.ai transformed sales coaching by integrating ElevenLabs' conversational AI, replacing outdated role-playing with lifelike simulations. This led to a significant 18% average increase in win-rates and a 30% performance boost for top users, proving the power of realistic AI in corporate training.

ElevenLabs

उच्चतम गुणवत्ता वाले AI ऑडियो के साथ बनाएं

मुफ़्त में आज़माएं

क्या आपके पास पहले से अकाउंट है? लॉग इन करें