Unterstützte Sprachen

Live Translate Live unterstützt 103 Sprachen für Echtzeit-Spracherkennung, 74 mit Live-KI-Sprachausgabe im Audio-Modus, und Übersetzung von jeder in jede Sprache über alle 103 hinweg — das sind 10.506 einzigartige Sprachpaare im Marquee. Diese Seite ist die maßgebliche Referenz: welche Sprachen unterstützt werden, wie genau jede erkannt wird und wo KI-Sprachausgabe verfügbar ist.

Genauigkeitsstufen der Spracherkennung

Wir verwenden ElevenLabs Scribe v2 Realtime für die Live-Spracherkennung. ElevenLabs veröffentlicht Wortfehlerrate-Benchmarks (WER) für Scribe über alle unterstützten Sprachen, eingeteilt in vier Stufen. Ein niedrigerer WER bedeutet, dass mehr Wörter korrekt erkannt werden. Die unten aufgeführten Stufen sind die veröffentlichten Benchmarks; in echten Gesprächen sind Mikrofonqualität und Umgebungsgeräusche wichtiger als der Unterschied zwischen den beiden obersten Stufen.

Stufe	WER	Sprachen
Ausgezeichnet	≤ 5%	Weißrussisch, Bosnisch, Bulgarisch, Katalanisch, Kroatisch, Tschechisch, Dänisch, Niederländisch, Englisch, Estnisch, Finnisch, Französisch, Galizisch, Deutsch, Griechisch, Ungarisch, Isländisch, Indonesisch, Italienisch, Japanisch, Kannada, Lettisch, Mazedonisch, Malaiisch, Malayalam, Norwegisch, Polnisch, Portugiesisch, Rumänisch, Russisch, Slowakisch, Spanisch, Schwedisch, Türkisch, Ukrainisch, Vietnamesisch (36)
Hoch	5–10%	Armenisch, Aserbaidschanisch, Bengalisch, Kantonesisch, Filipino, Georgisch, Gujarati, Hindi, Kasachisch, Litauisch, Maltesisch, Mandarin-Chinesisch, Marathi, Nepalesisch, Odia, Persisch, Serbisch, Slowenisch, Suaheli, Tamil, Telugu (21)
Gut	10–15%	Afrikaans, Arabisch, Assamesisch, Asturisch, Birmanisch, Hausa, Hebräisch, Javanisch, Koreanisch, Kirgisisch, Luxemburgisch, Māori, Okzitanisch, Punjabi, Tadschikisch, Thailändisch, Usbekisch, Walisisch (18)
In Entwicklung	15%+	Amharisch, Ganda, Igbo, Irisch, Khmer, Kurdisch, Laotisch, Mongolisch, Nord-Sotho, Paschtu, Shona, Sindhi, Somali, Urdu, Wolof, Xhosa, Yoruba, Zulu (18)

WER-Bereiche und Sprachgruppierungen basieren auf den von ElevenLabs veröffentlichten Scribe-v2-Benchmarks. Stufenpunkte erscheinen neben jeder Sprache in der In-App-Sprachauswahl, damit Sie auf einen Blick sehen können, was Sie erwartet. Der Benchmark umfasst etwa 93 Sprachen; unsere App unterstützt zusätzlich eine kleine Gruppe (Baschkirisch, Baskisch, Bretonisch, Färöisch, Haitianisches Kreolisch, Hawaiianisch, Latein, Lingala, Madagassisch, Sanskrit, Singhalesisch, Albanisch, Sundanesisch, Tatarisch, Turkmenisch, Jiddisch, Tibetisch), die Scribe verarbeitet, für die ElevenLabs jedoch keinen WER-Wert veröffentlicht hat — diese erscheinen in der Auswahl ohne Stufenpunkt und funktionieren im Gespräch; wir haben lediglich keine offizielle Genauigkeitszahl dafür.

Live-KI-Stimme (Audio-Modus)

Der Audio-Modus gibt den übersetzten Satz über den Lautsprecher Ihres Geräts wieder. Die Stimme wird von ElevenLabs v3 generiert (mit Flash v2.5 als schnellerem Fallback für die abgedeckten Sprachen). Wenn eine Sprache in keinem der TTS-Modelle enthalten ist, funktioniert der Audio-Modus trotzdem — Sie erhalten den übersetzten Text auf dem Bildschirm, nur ohne gesprochene Wiedergabe.

74 Sprachen verfügen heute über Live-Sprachausgabe. ElevenLabs erweitert diese Liste regelmäßig, und die App ruft die aktuelle Abdeckungsliste beim Start von der API ab — wenn v3 wächst, wächst Ihr Audio-Modus automatisch mit.

In der Sprachauswahl auf der Audio-Seite wird das Dropdown-Menü “Ihre Sprache” automatisch auf die Sprachen gefiltert, die Sprachausgabe unterstützen. Die Marquee-Auswahl zeigt alle 103, da die Laufschrift kein TTS benötigt.

Übersetzung über alle 103 Sprachen

Die Übersetzung läuft auf Google Gemini 2.5. Jede von Scribe erkannte Sprache kann in jede andere übersetzt werden — kein englischer Zwischenschritt erforderlich. Sie können Japanisch sprechen und es auf Portugiesisch ausgeben lassen, oder Hindi auf Arabisch, oder Koreanisch auf Suaheli. Mit 103 Quell- und Zielsprachen ergibt das 10.506 einzigartige Paare.

Gemini 2.5 trägt den Gesprächskontext über mehrere Gesprächsrunden hinweg. Pronomen, Genuskongruenz, idiomatische Formulierungen — der Übersetzer sieht, was zuvor gesagt wurde, und übersetzt die nächste Runde mit diesem Kontext. Das ist wichtiger, als die meisten Menschen erkennen: Ein einzelner Satz, der isoliert übersetzt wird, ist ungefähr eine Größenordnung schwieriger natürlich zu übersetzen als ein Satz, der als Teil eines laufenden Gesprächs übersetzt wird.

Regionale Varianten

Viele der 103 oben genannten Sprachen haben mehrere regionale Dialekte. Einige werden als einzelnes Modell behandelt, einige haben auswählbare regionale Varianten, und einige Sprachfamilien werden auf der Ebene der Spracherkennung auf eine dominante Variante reduziert.

Sprache	Regionale Varianten	Hinweise
Französisch	`fr` (Standard), `fr-CA` (Québec)	Québec-Französisch ist eine auswählbare Variante in der Sprachauswahl — nützlich, wenn ein Sprecher Québécois ist und der regionale Wortschatz eine Rolle spielt.
Portugiesisch	`pt` (Brasilianisch, Standard), `pt-PT` (Europäisch)	Brasilianisches Portugiesisch dominiert die Trainingsdaten. Europäisches Portugiesisch ist eine auswählbare Variante für Nutzer in Portugal oder mit lusófonen afrikanischen Sprechern.
Chinesisch	`zh` (Mandarin, Vereinfacht), `zh-TW` (Traditionell)	Mandarin ist das primäre gesprochene Ziel. Kantonesisch wird ebenfalls als eigener Eintrag in der Stufe „Hoch" unterstützt. Traditionelle und vereinfachte Schrift werden beide auf der Übersetzungsseite dargestellt.
Spanisch	Einzelnes Modell (iberisch und lateinamerikanisch)	Scribe verarbeitet beide regionalen Varianten sauber in einem Modell. Der Übersetzer bewahrt regionale Wortschatzunterschiede (coche vs. carro) in der Transkription und gibt sie in den Zielsprachen angemessen wieder.
Englisch	Einzelnes Modell (US-, UK-, AU-, IN-, NZ-, ZA-Akzente)	Die am stärksten trainierte Sprache mit guter akzentübergreifender Abdeckung. Indisches Englisch wird besonders gut verarbeitet.
Arabisch	Modernes Hocharabisch (primär)	MSA funktioniert am besten. Ägyptische, Golfstaaten-, levantinische und maghrebinische Dialekte werden mit unterschiedlicher Genauigkeit transkribiert — umgangssprachliche Dialektsprache ist der schwierigste Fall im gesamten Sprachsatz.
Hindi / Urdu	`hi`, `ur`	Linguistisch auf der gesprochenen Ebene sehr ähnlich, aber in unterschiedlichen Schriften geschrieben (Devanagari vs. Nastaliq). Beide werden als separate ASR-Ziele unterstützt.
Norwegisch	`no`, `nn` (Nynorsk)	Bokmål ist der Standard. Nynorsk ist für Sprecher dieser Schriftsprache auswählbar.
Serbisch / Kroatisch / Bosnisch	Separate Einträge pro Sprache	Auf der gesprochenen Ebene gegenseitig verständlich, aber als drei separate Sprachen mit eigenen Schriften und Normen behandelt.

Wenn eine regionale Variante in der Sprachauswahl verfügbar ist, verbessert die Auswahl der zum Sprecher passenden Variante die Transkriptionsgenauigkeit in der Regel merklich — besonders bei Portugiesisch und Französisch.

Zweiseitiges Gespräch

In einem zweiseitigen Gespräch zeigt die App die Wörter jedes Sprechers auf seiner eigenen Seite des Bildschirms. Der Marquee ordnet die Wörter eines Sprechers fast nie der falschen Seite zu; die schwierigsten Fälle in der Praxis sind sehr kurze Äußerungen („OK", „hmm", einzelne Eigennamen) und Code-Switching, bei dem ein zweisprachiger Sprecher mitten im Satz die Sprache wechselt. Beide Sprachen werden gleichzeitig übersetzt, sodass keiner der Sprecher auf den anderen warten muss.

Ausprobieren

Wählen Sie Ihre zwei Sprachen und starten Sie ein zweisprachiges Echtzeit-Gespräch. Keine App zum Herunterladen — alles läuft im Browser. Übersetzungsguthaben beginnen bei 1 $ für 15 Minuten; die Transkription im Audio-Modus ist kostenlos, bis Sie auf „Übersetzen" tippen.

Im Marquee starten · Audio-Modus ausprobieren · Preise ansehen · Alle Funktionen ansehen

Möchten Sie mehr über die Hintergründe erfahren? Lesen Sie, warum wir die Engines gewechselt haben, oder die Ankündigung des Starts mit 103 Sprachen.