समर्थित भाषाएँ

Live Translate Live 103 भाषाओं में रीयल-टाइम स्पीच रिकग्निशन का समर्थन करता है, 74 भाषाओं में लाइव AI वॉयस प्लेबैक के साथ Audio mode में, और सभी 103 भाषाओं में किसी भी भाषा से किसी भी भाषा में अनुवाद — यानी marquee में 10,506 अद्वितीय भाषा जोड़े। यह पृष्ठ आधिकारिक संदर्भ है: कौन सी भाषाएँ समर्थित हैं, प्रत्येक को कितनी सटीकता से पहचाना जाता है, और AI वॉयस कहाँ उपलब्ध है।

स्पीच रिकग्निशन सटीकता स्तर

हम लाइव स्पीच रिकग्निशन के लिए ElevenLabs Scribe v2 Realtime का उपयोग करते हैं। ElevenLabs अपनी समर्थित भाषाओं में Scribe के लिए वर्ड-एरर-रेट (WER) बेंचमार्क प्रकाशित करता है, जिन्हें चार स्तरों में वर्गीकृत किया गया है। कम WER का अर्थ है कि अधिक शब्द सही तरीके से पहचाने जाते हैं। नीचे दिए गए स्तर प्रकाशित बेंचमार्क हैं; वास्तविक बातचीत में, माइक्रोफ़ोन की गुणवत्ता और परिवेश का शोर शीर्ष दो स्तरों के बीच के अंतर से अधिक मायने रखते हैं।

स्तर	WER	भाषाएँ
उत्कृष्ट	≤ 5%	Belarusian, Bosnian, Bulgarian, Catalan, Croatian, Czech, Danish, Dutch, English, Estonian, Finnish, French, Galician, German, Greek, Hungarian, Icelandic, Indonesian, Italian, Japanese, Kannada, Latvian, Macedonian, Malay, Malayalam, Norwegian, Polish, Portuguese, Romanian, Russian, Slovak, Spanish, Swedish, Turkish, Ukrainian, Vietnamese (36)
उच्च	5–10%	Armenian, Azerbaijani, Bengali, Cantonese, Filipino, Georgian, Gujarati, Hindi, Kazakh, Lithuanian, Maltese, Mandarin Chinese, Marathi, Nepali, Odia, Persian, Serbian, Slovenian, Swahili, Tamil, Telugu (21)
अच्छा	10–15%	Afrikaans, Arabic, Assamese, Asturian, Burmese, Hausa, Hebrew, Javanese, Korean, Kyrgyz, Luxembourgish, Māori, Occitan, Punjabi, Tajik, Thai, Uzbek, Welsh (18)
विकासशील	15%+	Amharic, Ganda, Igbo, Irish, Khmer, Kurdish, Lao, Mongolian, Northern Sotho, Pashto, Shona, Sindhi, Somali, Urdu, Wolof, Xhosa, Yoruba, Zulu (18)

WER श्रेणियाँ और भाषा समूह ElevenLabs’ के प्रकाशित Scribe v2 बेंचमार्क पर आधारित हैं। ऐप के भाषा पिकर में प्रत्येक भाषा के बगल में स्तर के बिंदु दिखाई देते हैं ताकि आप एक नज़र में देख सकें कि क्या उम्मीद करनी है। बेंचमार्क लगभग 93 भाषाओं को कवर करता है; हमारा ऐप एक छोटे अतिरिक्त सेट (Bashkir, Basque, Breton, Faroese, Haitian Creole, Hawaiian, Latin, Lingala, Malagasy, Sanskrit, Sinhala, Albanian, Sundanese, Tatar, Turkmen, Yiddish, Tibetan) का समर्थन करता है जिन्हें Scribe संभालता है लेकिन जिनके लिए ElevenLabs’ ने WER स्तर प्रकाशित नहीं किया है — वे पिकर में बिना स्तर बिंदु के दिखाई देते हैं और बातचीत में काम करते हैं; हमारे पास बस संलग्न करने के लिए कोई आधिकारिक सटीकता संख्या नहीं है।

लाइव AI वॉयस (Audio Mode)

Audio mode अनुवादित वाक्य को आपके डिवाइस स्पीकर के माध्यम से ज़ोर से बजाता है। आवाज़ ElevenLabs v3 द्वारा उत्पन्न की जाती है (जिन भाषाओं को यह कवर करता है उनके लिए तेज़ फ़ॉलबैक के रूप में Flash v2.5 के साथ)। जब कोई भाषा किसी भी TTS मॉडल में नहीं होती, तो Audio mode फिर भी काम करता है — आपको स्क्रीन पर अनुवादित टेक्स्ट मिलेगा, बस बोली गई प्लेबैक के बिना।

आज 74 भाषाओं में लाइव वॉयस प्लेबैक उपलब्ध है। ElevenLabs समय-समय पर इस सूची में जोड़ता है, और ऐप स्टार्टअप पर API से वर्तमान कवरेज सूची खींचता है — इसलिए जब v3 बढ़ता है, तो आपका Audio mode स्वचालित रूप से उसके साथ बढ़ता है।

Audio पृष्ठ पर भाषा पिकर में, “उनकी भाषा” ड्रॉपडाउन स्वचालित रूप से उन भाषाओं तक फ़िल्टर किया जाता है जो वॉयस प्लेबैक का समर्थन करती हैं। marquee पिकर सभी 103 दिखाता है क्योंकि स्क्रॉलिंग डिस्प्ले को TTS की आवश्यकता नहीं है।

सभी 103 भाषाओं में अनुवाद

अनुवाद Google Gemini 2.5 पर चलता है। प्रत्येक Scribe-पहचानी गई भाषा हर दूसरी भाषा में और उससे अनुवाद कर सकती है — किसी अंग्रेज़ी मध्यस्थ की आवश्यकता नहीं। आप जापानी बोल सकते हैं और इसे पुर्तगाली में प्राप्त कर सकते हैं, या हिंदी से अरबी में, या कोरियाई से स्वाहिली में। 103 स्रोत-और-लक्ष्य भाषाओं के साथ, यह 10,506 अद्वितीय जोड़े हैं।

Gemini 2.5 बातचीत के दौरान संदर्भ बनाए रखता है। सर्वनाम, लिंग-आधारित सहमति, मुहावरेदार वाक्यांश — अनुवादक देखता है कि पहले क्या कहा गया था और उस संदर्भ को ध्यान में रखते हुए अगले मोड़ का अनुवाद करता है। यह लोगों की सोच से अधिक मायने रखता है: अलगाव में अनुवादित एक वाक्य को स्वाभाविक रूप से अनुवाद करना एक चल रही बातचीत के हिस्से के रूप में अनुवादित वाक्य की तुलना में लगभग एक परिमाण कठिन है।

क्षेत्रीय रूपांतर

उपरोक्त 103 भाषाओं में से कई के कई क्षेत्रीय बोलियाँ हैं। कुछ को एकल मॉडल के रूप में संभाला जाता है, कुछ में प्रति-क्षेत्र रूपांतर होते हैं जिन्हें आप चुन सकते हैं, और कुछ भाषा परिवार स्पीच-रिकग्निशन परत पर एक प्रमुख रूपांतर में सिमट जाते हैं।

भाषा	क्षेत्रीय रूपांतर	नोट्स
French	`fr` (डिफ़ॉल्ट), `fr-CA` (Quebec)	Quebec French पिकर में एक चयन योग्य रूपांतर है — तब उपयोगी जब एक वक्ता Québécois हो और क्षेत्रीय शब्दावली मायने रखती हो।
Portuguese	`pt` (ब्राज़ीलियाई डिफ़ॉल्ट), `pt-PT` (यूरोपीय)	ब्राज़ीलियाई Portuguese प्रशिक्षण डेटा पर हावी है। यूरोपीय Portuguese पुर्तगाल के उपयोगकर्ताओं या Lusófono अफ्रीकी वक्ताओं के लिए एक चयन योग्य रूपांतर है।
Chinese	`zh` (Mandarin, सरलीकृत), `zh-TW` (पारंपरिक)	Mandarin प्राथमिक बोला जाने वाला लक्ष्य है। Cantonese को भी उपरोक्त High स्तर में अपनी प्रविष्टि के रूप में समर्थित किया गया है। पारंपरिक और सरलीकृत दोनों लिपियाँ अनुवाद पक्ष पर प्रस्तुत होती हैं।
Spanish	एकल मॉडल (Iberian और Latin American को संभालता है)	Scribe एक मॉडल में दोनों क्षेत्रीय किस्मों को साफ़ तरीके से संभालता है। अनुवादक प्रतिलेखन में क्षेत्रीय शब्दावली अंतर (coche बनाम carro) को संरक्षित करता है और उन्हें लक्ष्य भाषाओं में उचित रूप से प्रस्तुत करता है।
English	एकल मॉडल (US, UK, AU, IN, NZ, ZA उच्चारण)	मज़बूत क्रॉस-एक्सेंट कवरेज के साथ सबसे अधिक प्रशिक्षित भाषा। भारतीय English विशेष रूप से अच्छी तरह से संभाली जाती है।
Arabic	Modern Standard Arabic (प्राथमिक)	MSA सबसे अच्छा काम करता है। Egyptian, Gulf, Levantine, और Maghrebi बोलियाँ अलग-अलग सटीकता के साथ प्रतिलेखित होती हैं — बोलचाल की बोली भाषण पूरे भाषा सेट में सबसे कठिन मामला है।
Hindi / Urdu	`hi`, `ur`	बोले जाने वाले स्तर पर भाषाई रूप से बहुत करीब लेकिन अलग-अलग लिपियों में लिखी जाती हैं (देवनागरी बनाम नस्तालीक)। दोनों को अलग ASR लक्ष्य के रूप में समर्थित किया गया है।
Norwegian	`no`, `nn` (Nynorsk)	Bokmål डिफ़ॉल्ट है। Nynorsk उस लिखित मानक के वक्ताओं के लिए चयन योग्य है।
Serbian / Croatian / Bosnian	प्रति भाषा अलग प्रविष्टियाँ	बोले जाने वाले स्तर पर परस्पर बोधगम्य लेकिन अपनी-अपनी लिपियों और मानदंडों के साथ तीन अलग भाषाओं के रूप में माना जाता है।

जब पिकर में कोई क्षेत्रीय रूपांतर उपलब्ध हो, तो वक्ता से मेल खाने वाला चुनने से आमतौर पर प्रतिलेखन सटीकता में उल्लेखनीय सुधार होता है — विशेष रूप से Portuguese और French के लिए।

दो-तरफ़ा बातचीत

दो-तरफ़ा बातचीत में, ऐप प्रत्येक वक्ता के शब्दों को स्क्रीन के अपने-अपने पक्ष पर रखता है। marquee लगभग कभी भी गलत वक्ता के शब्दों को गलत पक्ष पर नहीं रखता; व्यवहार में सबसे कठिन मामले अत्यंत छोटे उच्चारण (“OK”, “hmm”, एकल उचित संज्ञाएँ) और कोड-स्विचिंग हैं जहाँ एक द्विभाषी वक्ता वाक्य के बीच में भाषाएँ बदल देता है। दोनों भाषाओं का एक साथ अनुवाद किया जाता है, इसलिए किसी भी वक्ता को दूसरे के समाप्त होने की प्रतीक्षा नहीं करनी पड़ती।

इसे आज़माएँ

अपनी दो भाषाएँ चुनें और एक रीयल-टाइम द्विभाषी बातचीत शुरू करें। डाउनलोड करने के लिए कोई ऐप नहीं — सब कुछ ब्राउज़र में चलता है। अनुवाद क्रेडिट 15 मिनट के लिए $1 से शुरू होते हैं; Audio mode में प्रतिलेखन तब तक मुफ़्त है जब तक आप Translate नहीं टैप करते।

marquee में शुरू करें · Audio mode आज़माएँ · मूल्य निर्धारण देखें · सभी सुविधाएँ देखें

यहाँ तक पहुँचने के पर्दे के पीछे की जानकारी चाहते हैं? पढ़ें हमने इंजन क्यों बदले या 103-भाषा लॉन्च घोषणा।