समर्थित भाषाएँ

Live Translate Live 103 भाषाओं में रीयल-टाइम स्पीच रिकग्निशन का समर्थन करता है, 74 भाषाओं में लाइव AI वॉयस प्लेबैक के साथ Audio mode में, और सभी 103 भाषाओं में किसी भी भाषा से किसी भी भाषा में अनुवाद — यानी marquee में 10,506 अद्वितीय भाषा जोड़े। यह पृष्ठ आधिकारिक संदर्भ है: कौन सी भाषाएँ समर्थित हैं, प्रत्येक को कितनी सटीकता से पहचाना जाता है, और AI वॉयस कहाँ उपलब्ध है।

स्पीच रिकग्निशन सटीकता स्तर

हम लाइव स्पीच रिकग्निशन के लिए ElevenLabs Scribe v2 Realtime का उपयोग करते हैं। ElevenLabs अपनी समर्थित भाषाओं में Scribe के लिए वर्ड-एरर-रेट (WER) बेंचमार्क प्रकाशित करता है, जिन्हें चार स्तरों में वर्गीकृत किया गया है। कम WER का अर्थ है कि अधिक शब्द सही तरीके से पहचाने जाते हैं। नीचे दिए गए स्तर प्रकाशित बेंचमार्क हैं; वास्तविक बातचीत में, माइक्रोफ़ोन की गुणवत्ता और परिवेश का शोर शीर्ष दो स्तरों के बीच के अंतर से अधिक मायने रखते हैं।

स्तर WER भाषाएँ
उत्कृष्ट ≤ 5% Belarusian, Bosnian, Bulgarian, Catalan, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, Galician, German, Greek, Hungarian, Icelandic, Indonesian, Italian, Japanese, Kannada, Latvian, Macedonian, Malay, Malayalam, Norwegian, Polish, Portuguese, Romanian, Russian, Slovak, Spanish, Swedish, Turkish, Ukrainian, Vietnamese (36)
उच्च 5–10% Armenian, Azerbaijani, Bengali, Cantonese, Filipino, Georgian, Gujarati, Hindi, Kazakh, Lithuanian, Maltese, Mandarin Chinese, Marathi, Nepali, Odia, Persian, Serbian, Slovenian, Swahili, Tamil, Telugu (21)
अच्छा 10–15% Afrikaans, Arabic, Assamese, Asturian, Burmese, Hausa, Hebrew, Javanese, Korean, Kyrgyz, Luxembourgish, Māori, Occitan, Punjabi, Tajik, Thai, Uzbek, Welsh (18)
विकासशील 15%+ Amharic, Ganda, Igbo, Irish, Khmer, Kurdish, Lao, Mongolian, Northern Sotho, Pashto, Shona, Sindhi, Somali, Urdu, Wolof, Xhosa, Yoruba, Zulu (18)

WER श्रेणियाँ और भाषा समूह ElevenLabs’ के प्रकाशित Scribe v2 बेंचमार्क पर आधारित हैं। ऐप के भाषा पिकर में प्रत्येक भाषा के बगल में स्तर के बिंदु दिखाई देते हैं ताकि आप एक नज़र में देख सकें कि क्या उम्मीद करनी है। बेंचमार्क लगभग 93 भाषाओं को कवर करता है; हमारा ऐप एक छोटे अतिरिक्त सेट (Bashkir, Basque, Breton, Faroese, Haitian Creole, Hawaiian, Latin, Lingala, Malagasy, Sanskrit, Sinhala, Albanian, Sundanese, Tatar, Turkmen, Yiddish, Tibetan) का समर्थन करता है जिन्हें Scribe संभालता है लेकिन जिनके लिए ElevenLabs’ ने WER स्तर प्रकाशित नहीं किया है — वे पिकर में बिना स्तर बिंदु के दिखाई देते हैं और बातचीत में काम करते हैं; हमारे पास बस संलग्न करने के लिए कोई आधिकारिक सटीकता संख्या नहीं है।

लाइव AI वॉयस (Audio Mode)

Audio mode अनुवादित वाक्य को आपके डिवाइस स्पीकर के माध्यम से ज़ोर से बजाता है। आवाज़ ElevenLabs v3 द्वारा उत्पन्न की जाती है (जिन भाषाओं को यह कवर करता है उनके लिए तेज़ फ़ॉलबैक के रूप में Flash v2.5 के साथ)। जब कोई भाषा किसी भी TTS मॉडल में नहीं होती, तो Audio mode फिर भी काम करता है — आपको स्क्रीन पर अनुवादित टेक्स्ट मिलेगा, बस बोली गई प्लेबैक के बिना।

आज 74 भाषाओं में लाइव वॉयस प्लेबैक उपलब्ध है। ElevenLabs समय-समय पर इस सूची में जोड़ता है, और ऐप स्टार्टअप पर API से वर्तमान कवरेज सूची खींचता है — इसलिए जब v3 बढ़ता है, तो आपका Audio mode स्वचालित रूप से उसके साथ बढ़ता है।

Audio पृष्ठ पर भाषा पिकर में, “उनकी भाषा” ड्रॉपडाउन स्वचालित रूप से उन भाषाओं तक फ़िल्टर किया जाता है जो वॉयस प्लेबैक का समर्थन करती हैं। marquee पिकर सभी 103 दिखाता है क्योंकि स्क्रॉलिंग डिस्प्ले को TTS की आवश्यकता नहीं है।

सभी 103 भाषाओं में अनुवाद

अनुवाद Google Gemini 2.5 पर चलता है। प्रत्येक Scribe-पहचानी गई भाषा हर दूसरी भाषा में और उससे अनुवाद कर सकती है — किसी अंग्रेज़ी मध्यस्थ की आवश्यकता नहीं। आप जापानी बोल सकते हैं और इसे पुर्तगाली में प्राप्त कर सकते हैं, या हिंदी से अरबी में, या कोरियाई से स्वाहिली में। 103 स्रोत-और-लक्ष्य भाषाओं के साथ, यह 10,506 अद्वितीय जोड़े हैं।

Gemini 2.5 बातचीत के दौरान संदर्भ बनाए रखता है। सर्वनाम, लिंग-आधारित सहमति, मुहावरेदार वाक्यांश — अनुवादक देखता है कि पहले क्या कहा गया था और उस संदर्भ को ध्यान में रखते हुए अगले मोड़ का अनुवाद करता है। यह लोगों की सोच से अधिक मायने रखता है: अलगाव में अनुवादित एक वाक्य को स्वाभाविक रूप से अनुवाद करना एक चल रही बातचीत के हिस्से के रूप में अनुवादित वाक्य की तुलना में लगभग एक परिमाण कठिन है।

क्षेत्रीय रूपांतर

उपरोक्त 103 भाषाओं में से कई के कई क्षेत्रीय बोलियाँ हैं। कुछ को एकल मॉडल के रूप में संभाला जाता है, कुछ में प्रति-क्षेत्र रूपांतर होते हैं जिन्हें आप चुन सकते हैं, और कुछ भाषा परिवार स्पीच-रिकग्निशन परत पर एक प्रमुख रूपांतर में सिमट जाते हैं।

भाषा क्षेत्रीय रूपांतर नोट्स
French fr (डिफ़ॉल्ट), fr-CA (Quebec) Quebec French पिकर में एक चयन योग्य रूपांतर है — तब उपयोगी जब एक वक्ता Québécois हो और क्षेत्रीय शब्दावली मायने रखती हो।
Portuguese pt (ब्राज़ीलियाई डिफ़ॉल्ट), pt-PT (यूरोपीय) ब्राज़ीलियाई Portuguese प्रशिक्षण डेटा पर हावी है। यूरोपीय Portuguese पुर्तगाल के उपयोगकर्ताओं या Lusófono अफ्रीकी वक्ताओं के लिए एक चयन योग्य रूपांतर है।
Chinese zh (Mandarin, सरलीकृत), zh-TW (पारंपरिक) Mandarin प्राथमिक बोला जाने वाला लक्ष्य है। Cantonese को भी उपरोक्त High स्तर में अपनी प्रविष्टि के रूप में समर्थित किया गया है। पारंपरिक और सरलीकृत दोनों लिपियाँ अनुवाद पक्ष पर प्रस्तुत होती हैं।
Spanish एकल मॉडल (Iberian और Latin American को संभालता है) Scribe एक मॉडल में दोनों क्षेत्रीय किस्मों को साफ़ तरीके से संभालता है। अनुवादक प्रतिलेखन में क्षेत्रीय शब्दावली अंतर (coche बनाम carro) को संरक्षित करता है और उन्हें लक्ष्य भाषाओं में उचित रूप से प्रस्तुत करता है।
English एकल मॉडल (US, UK, AU, IN, NZ, ZA उच्चारण) मज़बूत क्रॉस-एक्सेंट कवरेज के साथ सबसे अधिक प्रशिक्षित भाषा। भारतीय English विशेष रूप से अच्छी तरह से संभाली जाती है।
Arabic Modern Standard Arabic (प्राथमिक) MSA सबसे अच्छा काम करता है। Egyptian, Gulf, Levantine, और Maghrebi बोलियाँ अलग-अलग सटीकता के साथ प्रतिलेखित होती हैं — बोलचाल की बोली भाषण पूरे भाषा सेट में सबसे कठिन मामला है।
Hindi / Urdu hi, ur बोले जाने वाले स्तर पर भाषाई रूप से बहुत करीब लेकिन अलग-अलग लिपियों में लिखी जाती हैं (देवनागरी बनाम नस्तालीक)। दोनों को अलग ASR लक्ष्य के रूप में समर्थित किया गया है।
Norwegian no, nn (Nynorsk) Bokmål डिफ़ॉल्ट है। Nynorsk उस लिखित मानक के वक्ताओं के लिए चयन योग्य है।
Serbian / Croatian / Bosnian प्रति भाषा अलग प्रविष्टियाँ बोले जाने वाले स्तर पर परस्पर बोधगम्य लेकिन अपनी-अपनी लिपियों और मानदंडों के साथ तीन अलग भाषाओं के रूप में माना जाता है।

जब पिकर में कोई क्षेत्रीय रूपांतर उपलब्ध हो, तो वक्ता से मेल खाने वाला चुनने से आमतौर पर प्रतिलेखन सटीकता में उल्लेखनीय सुधार होता है — विशेष रूप से Portuguese और French के लिए।

दो-तरफ़ा बातचीत

दो-तरफ़ा बातचीत में, ऐप प्रत्येक वक्ता के शब्दों को स्क्रीन के अपने-अपने पक्ष पर रखता है। marquee लगभग कभी भी गलत वक्ता के शब्दों को गलत पक्ष पर नहीं रखता; व्यवहार में सबसे कठिन मामले अत्यंत छोटे उच्चारण (“OK”, “hmm”, एकल उचित संज्ञाएँ) और कोड-स्विचिंग हैं जहाँ एक द्विभाषी वक्ता वाक्य के बीच में भाषाएँ बदल देता है। दोनों भाषाओं का एक साथ अनुवाद किया जाता है, इसलिए किसी भी वक्ता को दूसरे के समाप्त होने की प्रतीक्षा नहीं करनी पड़ती।

इसे आज़माएँ

अपनी दो भाषाएँ चुनें और एक रीयल-टाइम द्विभाषी बातचीत शुरू करें। डाउनलोड करने के लिए कोई ऐप नहीं — सब कुछ ब्राउज़र में चलता है। अनुवाद क्रेडिट 15 मिनट के लिए $1 से शुरू होते हैं; Audio mode में प्रतिलेखन तब तक मुफ़्त है जब तक आप Translate नहीं टैप करते।

marquee में शुरू करें · Audio mode आज़माएँ · मूल्य निर्धारण देखें · सभी सुविधाएँ देखें

यहाँ तक पहुँचने के पर्दे के पीछे की जानकारी चाहते हैं? पढ़ें हमने इंजन क्यों बदले या 103-भाषा लॉन्च घोषणा