103 unterstützte Sprachen für Echtzeit-Übersetzung — in jede Richtung

Aktualisiert Mai 2026

Suchen Sie eine Echtzeit-Übersetzungs-App, die Ihr Sprachpaar unterstützt? Live Translate Live unterstützt 103 Sprachen mit simultaner bidirektionaler Übersetzung in jede Richtung. Das sind 10.506 mögliche Sprachkombinationen — alle mit live scrollender Übersetzung auf dem Bildschirm und KI-Sprachausgabe in 74 davon. Die vollständige kanonische Referenz (mit Genauigkeitsstufen pro Sprache) finden Sie unter /languages; dieser Beitrag führt durch die Liste und erklärt, was Sie von verschiedenen Sprachpaaren erwarten können.

Vollständige Liste der unterstützten Sprachen

Jede der folgenden Sprachen funktioniert sowohl als Quell- als auch als Zielsprache. Wählen Sie beliebige zwei und starten Sie ein zweisprachiges Gespräch mit Echtzeit-Übersetzung.

  • Afrikaans
  • Albanisch
  • Amharisch
  • Arabisch
  • Armenisch
  • Assamesisch
  • Aserbaidschanisch
  • Baschkirisch
  • Baskisch
  • Weißrussisch
  • Bengalisch
  • Bosnisch
  • Bretonisch
  • Bulgarisch
  • Birmanisch
  • Katalanisch
  • Chinesisch (Mandarin)
  • Chinesisch (Traditionell)
  • Kroatisch
  • Tschechisch
  • Dänisch
  • Niederländisch
  • Englisch
  • Estnisch
  • Färöisch
  • Filipino
  • Finnisch
  • Französisch
  • Französisch (Kanada)
  • Galizisch
  • Georgisch
  • Deutsch
  • Griechisch
  • Gujarati
  • Haitianisches Kreolisch
  • Hausa
  • Hawaiianisch
  • Hebräisch
  • Hindi
  • Ungarisch
  • Isländisch
  • Indonesisch
  • Italienisch
  • Japanisch
  • Javanisch
  • Kannada
  • Kasachisch
  • Khmer
  • Koreanisch
  • Laotisch
  • Latein
  • Lettisch
  • Lingala
  • Litauisch
  • Luxemburgisch
  • Mazedonisch
  • Malagasy
  • Malaiisch
  • Malayalam
  • Maltesisch
  • Māori
  • Marathi
  • Mongolisch
  • Nepalesisch
  • Norwegisch
  • Norwegisch Nynorsk
  • Okzitanisch
  • Paschtu
  • Persisch
  • Polnisch
  • Portugiesisch
  • Portugiesisch (Portugal)
  • Punjabi
  • Rumänisch
  • Russisch
  • Sanskrit
  • Serbisch
  • Shona
  • Sindhi
  • Singhalesisch
  • Slowakisch
  • Slowenisch
  • Somali
  • Spanisch
  • Sundanesisch
  • Suaheli
  • Schwedisch
  • Tagalog
  • Tadschikisch
  • Tamil
  • Tatarisch
  • Telugu
  • Thailändisch
  • Tibetisch
  • Türkisch
  • Turkmenisch
  • Ukrainisch
  • Urdu
  • Usbekisch
  • Vietnamesisch
  • Walisisch
  • Jiddisch
  • Yoruba

Spracherkennung vs. Übersetzung: Zwei verschiedene Ebenen

Ein kurzer Hinweis, der beim Vergleich von Tools hilfreich ist: „Sprachunterstützung" in einer Live-Übersetzungs-App besteht tatsächlich aus zwei verschiedenen Dingen, die übereinandergestapelt sind. Zunächst muss die App erkennen, was Sie gesagt haben (Sprache-zu-Text, oder ASR). Dann muss sie diesen Text in die andere Sprache übersetzen (maschinelle Übersetzung, oder MT). Das sind separate Systeme mit separater Abdeckung.

Live Translate Live verwendet ElevenLabs Scribe v2 Realtime für die Spracherkennung und Google Gemini 2.5 für die Übersetzung. Die obige Liste mit 103 Sprachen entspricht dem, was Scribe v2 streamt; Gemini 2.5 deckt all diese und viele weitere auf der Textübersetzungsseite ab. Der limitierende Faktor bei der Live-Sprachübersetzung ist fast immer die ASR-Schicht, nicht die Übersetzungsschicht.

Deshalb kann eine Sprache in der Textoberfläche von Google Translate erscheinen, aber nicht in einer Live-Sprach-App. Textübersetzung benötigt nur die MT-Schicht. Live-Sprachübersetzung benötigt beide Schichten, die in Millisekunden funktionieren müssen – bei einem gestreamten Audiofeed, mit welchem Akzent und Hintergrundgeräusch das Mikrofon auch immer aufnimmt. Wenn eine Sprache unter eine nutzbare Streaming-ASR-Qualität fällt, lassen wir sie lieber weg, als etwas zu liefern, das die Hälfte des Gesprächs falsch transkribiert.

ElevenLabs veröffentlicht ein vierstufiges Wortfehlerrate-Raster (WER) für Scribe v2 — Ausgezeichnet (≤5%), Hoch (5–10%), Gut (10–15%) und In Entwicklung (15%+). Wir zeigen diese Stufen als farbige Punkte neben jeder Sprache in der In-App-Auswahl an, und die vollständige Aufschlüsselung finden Sie unter /languages. Der neue Launch-Ankündigungsbeitrag behandelt den Engine-Wechsel und was sich für Nutzer geändert hat.

Sprachen und regionale Varianten

Viele der 103 Sprachen oben haben mehrere regionale Dialekte. Einige werden als einzelnes Modell behandelt, einige haben auswählbare regionale Varianten, und einige große Sprachfamilien werden auf der ASR-Ebene auf eine dominante Variante reduziert. So sieht es bei den häufigsten aus.

Sprache Regionale Varianten Hinweise
Spanisch Einzelnes Modell (verarbeitet Iberisch und Lateinamerikanisch) Scribe verarbeitet beide regionalen Varianten sauber in einem Modell. Regionale Vokabularunterschiede (z. B. coche vs. carro) werden in der Transkription beibehalten und vom Übersetzer sauber in andere Sprachen übertragen.
Portugiesisch pt (Brasilianisch Standard), pt-PT (Europäisch) Brasilianisches Portugiesisch dominiert die Trainingsdaten und wird sehr zuverlässig transkribiert. Europäisches Portugiesisch ist eine auswählbare Variante; nützlich für Nutzer in Portugal oder mit lusofonen afrikanischen Sprechern.
Französisch fr (Standard), fr-CA (Québec) Québec-Französisch ist eine auswählbare Variante. Das Standardmodell verarbeitet fr-FR, fr-BE, fr-CH sauber; sehr starker regionaler Québec-Slang kann gelegentlich im Transkript in Richtung Standardfranzösisch normalisiert werden, sofern Sie nicht die fr-CA-Variante auswählen.
Englisch Einzelnes Modell (US-, UK-, AU-, IN-, NZ-, ZA-Akzente) Die am stärksten trainierte Sprache mit ausgezeichneter Abdeckung der wichtigsten Akzente. Indisches Englisch wird besonders gut verarbeitet.
Chinesisch Mandarin (zh), Traditionell (zh-TW); Kantonesisch als eigener Eintrag Mandarin ist das primäre gesprochene Ziel. Kantonesisch wird als eigene Sprache in der Auswahl unterstützt. Vereinfachte und traditionelle Schrift werden auf der Übersetzungsseite korrekt dargestellt.
Arabisch Modernes Hocharabisch (primär) Arabisch wird unterstützt, aber die Dialektverarbeitung variiert. MSA funktioniert am besten. Ägyptische, Golf-, levantinische und maghrebinische Dialekte werden mit unterschiedlicher Genauigkeit transkribiert — umgangssprachliche Dialektsprache ist der schwierigste Fall im gesamten Sprachsatz.
Hindi / Urdu hi, ur Linguistisch auf der gesprochenen Ebene sehr ähnlich, aber in verschiedenen Schriften geschrieben (Devanagari vs. Nastaliq). Beide werden als separate ASR-Ziele unterstützt.
Norwegisch no (Bokmål), nn (Nynorsk) Bokmål ist der Standard. Nynorsk ist eine auswählbare Variante für Sprecher dieses Schriftstandards.
Serbisch / Kroatisch / Bosnisch Separate Modelle pro Sprache Auf der gesprochenen Ebene gegenseitig verständlich, aber als drei separate Sprachen mit eigenen Schriften und Normen behandelt. Serbisch unterstützt sowohl kyrillische als auch lateinische Schriftausgabe.

Wenn die Auswahl eine bestimmte regionale Variante anbietet, verbessert die Auswahl der zum Sprecher passenden Variante die Transkriptionsgenauigkeit in der Regel spürbar — besonders bei Portugiesisch und Französisch.

Welche Sprachpaare am besten abschneiden

Alle 10.506 Paare funktionieren, aber sie fühlen sich nicht alle gleich an. Drei Faktoren bestimmen die reale Erfahrung mit einem bestimmten Paar:

Die Paare, die sich in der Praxis am schnellsten und flüssigsten anfühlen:

Paare, die gut funktionieren, aber mehr sichtbares „Nachdenken" vor dem Erscheinen jedes Satzes zeigen:

Was „Echtzeit" tatsächlich bedeutet

„Echtzeit" ist ein dehnbarer Begriff, daher hier, wie es in der Praxis aussieht. Während Sie sprechen, erscheinen Wörter fast sofort auf dem Bildschirm — vorläufiger Text, der sich festigt, wenn der Erkenner mehr vom Satz hört. ElevenLabs veröffentlicht ~150 ms Streaming-Latenz für Scribe v2, und die meisten Wörter erscheinen innerhalb von ~400–800 ms nach dem Sprechen.

Die Übersetzung setzt ein, sobald jeder Satz abgeschlossen ist. Gemini 2.5 liefert eine Übersetzung in wenigen hundert Millisekunden, mit dem Vorteil, dass es die vorherigen Gesprächsrunden sieht und den Gesprächskontext über diese hinweg beibehält. Die End-to-End-Latenz von „Sprecher beendet einen Satz" bis „Zuhörer sieht die Übersetzung" liegt in der Regel unter einer Sekunde.

Deshalb ist die Wortstellung wichtig: Der Erkenner zeigt gerne vorläufigen Text an, während Sie sprechen, aber der Übersetzer benötigt eine kohärente Phrase, mit der er arbeiten kann. Bei Englisch ↔ Spanisch kommt diese Satzgrenze in beiden Sprachen an ungefähr derselben Stelle. Bei Englisch ↔ Japanisch nicht — weshalb japanische Übersetzungen in etwas größeren Schüben erscheinen als spanische.

Sonderfälle: Dialekte, Schriften und Namen

Live-Gespräche bleiben selten innerhalb der ordentlichen Grenzen einer einzigen Sprache. Einige Sonderfälle sind es wert, erwähnt zu werden, weil sie häufig vorkommen.

Code-Switching. Zweisprachige Sprecher mischen oft Sprachen mitten im Satz — Spanglish, Hinglish, Franglais. Die App verarbeitet dies meistens problemlos und zeigt jede Sprache auf der richtigen Seite des Bildschirms an, auch wenn ein Sprecher mitten in einer Äußerung wechselt. Bei vorhersehbarem Code-Switching hilft es dennoch, pro Sprecher eine Sprache zuzuweisen; bei gelegentlichen Wörtern verzeiht die Übersetzungsschicht in der Regel kleine Transkriptionsfehler.

Eigennamen und Namen. Namen von Personen, Unternehmen und Orten sind das Schwierigste für ein ASR-System, weil sie nicht den Wörterbuchverteilungen folgen. Gelegentlich wird ein Name phonetisch seltsam ausgegeben. Die Übersetzungsschicht lässt Eigennamen in der Regel unübersetzt, was das korrekte Verhalten ist — „Guillermo" sollte auf Englisch „Guillermo" bleiben und nicht zu „William" werden. Bei wichtigen Namen (Arzttermine, rechtliche Gespräche) hilft es, den Namen einmal auch schriftlich einzugeben oder zu zeigen. Sie können Namen auch als Schlüsselbegriffe über das Menü hinzufügen — Scribe v2 unterstützt Schlüsselbegriff-Prompting, das die Engine darauf ausrichtet, die von Ihnen angegebenen Namen zu erkennen.

„Unübersetzbare" kulturelle Begriffe. Wörter wie Schadenfreude, saudade, hygge oder giri haben keine sauberen einwörtigen Entsprechungen im Englischen. Gemini 2.5 wird entweder transliterieren (das Originalwort beibehalten) oder umschreiben (z. B. „ein gemütliches Gefühl der Zufriedenheit" für hygge). Umschreibungen können lang sein — gelegentlich erzeugt ein einzelnes Wort in der Quellsprache eine Phrase in der Zielsprache. Dies ist erwartetes Verhalten, kein Fehler.

Fachbegriffe und Branchenvokabular. Medizinische Begriffe, Rechtsbegriffe und Produktnamen werden vom Übersetzer im Allgemeinen gut verarbeitet, können aber bei Sprachen der Stufen Gut oder In Entwicklung die ASR ins Stolpern bringen. Wenn Sie die App für ein fachspezifisches Gespräch in einer kleineren Sprache verwenden, rechnen Sie bei Fachbegriffen mit gelegentlich unscharfen Transkripten — und für wirklich sicherheitskritische Situationen ist ein menschlicher Dolmetscher nach wie vor die richtige Wahl.

Mehrsprachige Haushalte. Für zweisprachige Familien, in denen eine Person eine Sprache spricht und eine andere in einer anderen Sprache antwortet, verarbeitet Live Translate Lives Zwei-Stream-Architektur dies nativ — die Seite jedes Sprechers im Gespräch wird in die Sprache der anderen Seite übersetzt, unabhängig davon, wer gerade spricht.

In jede Richtung

Die meisten Übersetzungs-Apps übersetzen nur zu und von Englisch. Live Translate Live ist anders — es unterstützt Übersetzung in jede Richtung zwischen allen 103 Sprachen. Das bedeutet, Sie können direkt zwischen Japanisch und Französisch, Arabisch und Koreanisch, Hindi und Portugiesisch, Vietnamesisch und Polnisch oder jeder anderen Kombination übersetzen. Kein englischer Zwischenschritt erforderlich.

Mit 103 Sprachen und Paarung in jede Richtung erhalten Sie 10.506 einzigartige Sprachpaare. Beide Seiten des Gesprächs werden gleichzeitig mit bidirektionaler Übersetzung übersetzt, sodass keiner der Sprecher warten muss.

Live-KI-Stimme in 74 Sprachen (Audio-Modus)

Zusätzlich zum scrollenden Laufband gibt der Audio-Modus den übersetzten Satz über den Gerätlautsprecher mit ElevenLabs v3 wieder (mit Flash v2.5 als schnellerer Alternative für die Sprachen, die es abdeckt). 74 der 103 unterstützten Sprachen verfügen heute über KI-Sprachausgabe; die übrigen funktionieren weiterhin im Audio-Modus, Sie sehen den übersetzten Text jedoch ohne gesprochene Wiedergabe auf dem Bildschirm.

Der Audio-Modus ist das richtige Werkzeug, wenn das Lesen einer scrollenden Anzeige nicht praktisch ist — auf Märkten, in Taxis, in Krankenhauswartezimmern, überall dort, wo Sie das Telefon natürlich hin- und herreichen würden. Die ausführliche Beschreibung finden Sie in unserem Audio-Modus-Beitrag.

Beliebte Sprachpaare

Obwohl jede Kombination funktioniert, sind hier einige der am häufigsten verwendeten Paare auf Live Translate Live:

Ihr Paar nicht aufgeführt? Wenn beide Sprachen in der obigen unterstützten Liste stehen, funktionieren sie zusammen — alle 10.506 Kombinationen werden vollständig unterstützt.

Häufig gestellte Fragen

Werden Akzente verarbeitet?

Ja, über ein breites Spektrum. Scribe v2 wird auf vielfältigen Akzentdaten trainiert, und Englisch verarbeitet insbesondere US-, UK-, australische, indische und südafrikanische Akzente sauber. Bei anderen Sprachen werden starke regionale Akzente innerhalb eines Landes (z. B. ausgeprägte ländliche Dialekte) etwas höhere Fehlerquoten aufweisen als Nachrichtensprechersprache, aber der allgemeine Trend im Jahr 2026 ist, dass modernes ASR merklich weniger akzentsensitiv ist als ältere Systeme. Wenn ein bestimmter Sprecher schlechte Erkennung erhält, ist die größte einzelne Verbesserung in der Regel eine bessere Mikrofonposition und nicht eine andere Spracheinstellung.

Was passiert, wenn ein Wort in der Zielsprache nicht existiert?

Gemini 2.5 wird entweder transliterieren (das Originalwort beibehalten, manchmal in der Zielschrift dargestellt) oder umschreiben (eine kurze Phrase verwenden, die die Bedeutung erfasst). Bei Lehnwörtern, die in der Zielsprache bereits gebräuchlich sind — „Computer", „Taxi", „Sushi" — werden sie einfach durchgereicht. Bei wirklich kulturspezifischen Wörtern ohne direkte Entsprechung ist eine Umschreibung zu erwarten. Keiner der Fälle unterbricht das Gespräch; gelegentlich erhalten Sie nur einen etwas längeren Satz als der Sprecher produziert hat.

Müssen beide Sprecher denselben Browser verwenden?

Nein. Live Translate Live ist eine Einzelbildschirm-App — die übliche Einrichtung sind zwei Personen auf einem Gerät, die entweder nebeneinander sitzen oder den vis-à-vis-Modus verwenden, um die Anzeige von gegenüberliegenden Seiten eines Tisches zu lesen. Für den zweiten Sprecher ist keine separate Anmeldung oder App-Installation erforderlich; er muss nur in Reichweite des Mikrofons sein. Für Einrichtungen quer durch einen Raum oder auf einem Fernseher kann die Anzeige gespiegelt oder auf einem separaten Bildschirm geöffnet werden.

Kann ich die Sprachen mitten im Gespräch wechseln?

Ja. Die Sprachauswahl ist live — Sie können die Sprache jeder Seite jederzeit ändern, ohne die Sitzung zu beenden. Dies ist nützlich, wenn eine dritte Person in einer anderen Sprache einem Gespräch beitritt oder wenn ein zweisprachiger Sprecher auf halbem Weg von einer Sprache zur anderen wechselt. Guthaben werden über den Wechsel hinweg ununterbrochen verbraucht.

Probieren Sie es mit Ihrem Sprachpaar aus

Wählen Sie Ihre zwei Sprachen und starten Sie in Sekunden ein zweisprachiges Echtzeit-Gespräch. Live Translate Live funktioniert in Ihrem Browser — keine App zum Herunterladen. Beide Sprecher sehen eine scrollende Übersetzungsanzeige mit Live-Übersetzungen während sie sprechen, oder Sie können zum Audio-Modus für die handgehaltene Einzelnutzung mit KI-Sprachausgabe wechseln.

Übersetzungsguthaben beginnen bei nur 1 $ für 15 Minuten. Kein Abonnement erforderlich.

Übersetzung starten · Audio-Modus · Vollständige Sprachreferenz · Preise ansehen


Live Translate Live ausprobieren

Beginnen Sie noch heute mit der Echtzeit-Übersetzung zweisprachiger Gespräche.

Kostenlos loslegen