103 langues prises en charge pour la traduction en temps réel — Dans toutes les directions

Mis à jour en mai 2026

Vous cherchez une application de traduction en temps réel qui prend en charge votre paire de langues ? Live Translate Live prend en charge 103 langues avec une traduction bidirectionnelle simultanée dans toutes les directions. Cela représente 10 506 combinaisons de langues possibles — toutes avec une traduction défilante en direct à l'écran, et une lecture vocale par IA pour 74 d'entre elles. La référence canonique complète (avec les niveaux de précision par langue) se trouve sur /languages ; cet article parcourt la liste et explique ce que vous pouvez attendre des différentes paires de langues.

Liste complète des langues prises en charge

Chaque langue ci-dessous fonctionne à la fois comme langue source et comme langue cible. Choisissez-en deux et démarrez une conversation bilingue avec traduction en temps réel.

  • Afrikaans
  • Albanais
  • Amharique
  • Arabe
  • Arménien
  • Assamais
  • Azerbaïdjanais
  • Bachkir
  • Basque
  • Biélorusse
  • Bengali
  • Bosnien
  • Breton
  • Bulgare
  • Birman
  • Catalan
  • Chinois (mandarin)
  • Chinois (traditionnel)
  • Croate
  • Tchèque
  • Danois
  • Néerlandais
  • Anglais
  • Estonien
  • Féroïen
  • Filipino
  • Finnois
  • Français
  • Français (Canada)
  • Galicien
  • Géorgien
  • Allemand
  • Grec
  • Gujarati
  • Créole haïtien
  • Haoussa
  • Hawaïen
  • Hébreu
  • Hindi
  • Hongrois
  • Islandais
  • Indonésien
  • Italien
  • Japonais
  • Javanais
  • Kannada
  • Kazakh
  • Khmer
  • Coréen
  • Laotien
  • Latin
  • Letton
  • Lingala
  • Lituanien
  • Luxembourgeois
  • Macédonien
  • Malgache
  • Malais
  • Malayalam
  • Maltais
  • Māori
  • Marathi
  • Mongol
  • Népalais
  • Norvégien
  • Norvégien nynorsk
  • Occitan
  • Pachto
  • Persan
  • Polonais
  • Portugais
  • Portugais (Portugal)
  • Pendjabi
  • Roumain
  • Russe
  • Sanskrit
  • Serbe
  • Shona
  • Sindhi
  • Cingalais
  • Slovaque
  • Slovène
  • Somali
  • Espagnol
  • Soundanais
  • Swahili
  • Suédois
  • Tagalog
  • Tadjik
  • Tamoul
  • Tatar
  • Télougou
  • Thaï
  • Tibétain
  • Turc
  • Turkmène
  • Ukrainien
  • Ourdou
  • Ouzbek
  • Vietnamien
  • Gallois
  • Yiddish
  • Yoruba

Reconnaissance vocale et traduction : deux couches distinctes

Un point important à comprendre si vous comparez des outils : la « prise en charge des langues » dans une application de traduction en direct recouvre en réalité deux choses différentes superposées. L'application doit d'abord reconnaître ce que vous avez dit (parole-vers-texte, ou ASR). Ensuite, elle doit traduire ce texte dans l'autre langue (traduction automatique, ou MT). Ce sont des systèmes distincts avec des couvertures distinctes.

Live Translate Live utilise ElevenLabs Scribe v2 Realtime pour la reconnaissance vocale et Google Gemini 2.5 pour la traduction. La liste de 103 langues ci-dessus correspond à ce que Scribe v2 diffuse en continu ; Gemini 2.5 couvre toutes ces langues et bien d'autres encore du côté de la traduction de texte. Le facteur limitant pour la traduction vocale en direct est presque toujours la couche ASR, et non la couche de traduction.

C'est pourquoi une langue peut apparaître dans l'interface texte de Google Traduction mais pas dans une application de traduction vocale en direct. La traduction de texte n'a besoin que de la couche MT. La traduction vocale en direct nécessite que les deux couches fonctionnent en quelques millisecondes, sur un flux audio en continu, avec l'accent et le bruit de fond que le microphone capte. Lorsqu'une langue descend en dessous d'une qualité d'ASR en continu utilisable, nous préférons l'exclure plutôt que de livrer quelque chose qui transcrit mal la moitié de la conversation.

ElevenLabs publie une grille de taux d'erreur par mot (WER) à quatre niveaux pour Scribe v2 — Excellent (≤5 %), Élevé (5–10 %), Bon (10–15 %) et En développement (15 %+). Nous affichons ces niveaux sous forme de points colorés à côté de chaque langue dans le sélecteur intégré à l'application, et le détail complet est disponible sur /languages. Le billet d'annonce de lancement couvre le changement de moteur et ce qui a changé pour les utilisateurs.

Langues et variantes régionales

Beaucoup des 103 langues ci-dessus ont plusieurs dialectes régionaux. Certains sont gérés par un seul modèle, d'autres disposent de variantes par région que vous pouvez sélectionner, et quelques grandes familles linguistiques se regroupent en une variante dominante au niveau de l'ASR. Voici comment les plus courantes se répartissent.

Langue Variantes régionales Remarques
Espagnol Modèle unique (gère l'espagnol ibérique et latino-américain) Scribe gère proprement les deux variantes régionales dans un seul modèle. Les différences de vocabulaire régional (p. ex. coche vs carro) sont préservées dans la transcription et le traducteur les gère proprement vers d'autres langues.
Portugais pt (brésilien par défaut), pt-PT (européen) Le portugais brésilien domine les données d'entraînement et se transcrit de manière très fiable. Le portugais européen est une variante sélectionnable ; utile pour les utilisateurs au Portugal ou avec des locuteurs africains lusophones.
Français fr (par défaut), fr-CA (québécois) Le français québécois est une variante sélectionnable. Le modèle par défaut gère proprement le fr-FR, le fr-BE et le fr-CH ; l'argot québécois très marqué peut occasionnellement être normalisé vers le français standard dans la transcription, sauf si vous choisissez la variante fr-CA.
Anglais Modèle unique (accents américain, britannique, australien, indien, néo-zélandais, sud-africain) La langue la plus entraînée, avec une excellente couverture des principaux accents. L'anglais indien est notamment bien géré.
Chinois Mandarin (zh), traditionnel (zh-TW) ; cantonais comme entrée distincte Le mandarin est la cible orale principale. Le cantonais est pris en charge comme langue distincte dans le sélecteur. Les écritures simplifiée et traditionnelle s'affichent toutes deux correctement du côté de la traduction.
Arabe Arabe standard moderne (principal) L'arabe est pris en charge, mais la gestion des dialectes varie. L'ASM fonctionne le mieux. Les dialectes égyptien, du Golfe, levantin et maghrébin se transcrivent avec une précision variable — le discours en dialecte familier est le cas le plus difficile de tout l'ensemble linguistique.
Hindi / Ourdou hi, ur Linguistiquement très proches à l'oral, mais écrits dans des scripts différents (devanagari vs nastaliq). Les deux sont pris en charge comme cibles ASR distinctes.
Norvégien no (Bokmål), nn (Nynorsk) Le bokmål est la variante par défaut. Le nynorsk est une variante sélectionnable pour les locuteurs de cette norme écrite.
Serbe / Croate / Bosnien Modèles distincts par langue Mutuellement intelligibles à l'oral, mais traités comme trois langues distinctes avec leurs propres scripts et normes. Le serbe prend en charge la sortie en alphabet cyrillique et en alphabet latin.

Lorsque le sélecteur propose une variante régionale spécifique, choisir celle qui correspond au locuteur améliore généralement la précision de la transcription de manière notable — en particulier pour le portugais et le français.

Quelles paires de langues offrent les meilleures performances

Les 10 506 paires fonctionnent toutes, mais elles ne se ressentent pas toutes de la même façon. Trois facteurs déterminent l'expérience réelle d'une paire donnée :

Les paires qui se ressentent comme les plus rapides et les plus fluides en pratique :

Paires qui fonctionnent bien mais montrent une « réflexion » plus visible avant l'apparition de chaque phrase :

Ce que « temps réel » signifie vraiment

« Temps réel » est un terme vague, voici donc ce que cela donne en pratique. Pendant que vous parlez, les mots commencent à apparaître à l'écran presque immédiatement — un texte provisoire qui se stabilise au fur et à mesure que le système de reconnaissance entend davantage de la phrase. ElevenLabs publie une latence de diffusion en continu d'environ 150 ms pour Scribe v2, et la plupart des mots apparaissent dans les ~400–800 ms suivant leur prononciation.

La traduction se déclenche une fois chaque phrase finalisée. Gemini 2.5 renvoie une traduction en quelques centaines de millisecondes, avec l'avantage de voir les tours précédents et de maintenir le contexte conversationnel tout au long. La latence de bout en bout entre « le locuteur termine une phrase » et « l'auditeur voit la traduction » est généralement inférieure à une seconde.

C'est pourquoi l'ordre des mots est important : le système de reconnaissance affichera volontiers du texte provisoire pendant que vous parlez, mais le traducteur a besoin d'une proposition cohérente pour travailler. En anglais ↔ espagnol, cette limite de proposition se situe à peu près au même endroit dans les deux langues. En anglais ↔ japonais, ce n'est pas le cas — c'est pourquoi les traductions japonaises apparaissent en blocs légèrement plus grands que les traductions espagnoles.

Cas particuliers : dialectes, scripts et noms propres

Une conversation en direct sort rarement des frontières nettes d'une seule langue. Quelques cas particuliers méritent d'être signalés car ils reviennent souvent.

Alternance codique. Les locuteurs bilingues mélangent souvent les langues en milieu de phrase — spanglish, hinglish, franglais. L'application gère cela avec souplesse la plupart du temps, plaçant chaque langue du bon côté de l'écran même lorsqu'un locuteur bascule en milieu d'énoncé. Pour une alternance codique prévisible, il est toujours utile d'attribuer une langue par locuteur ; pour les mots isolés, la couche de traduction pardonne généralement les petites imperfections de transcription.

Noms propres et noms de personnes. Les noms de personnes, d'entreprises et de lieux sont ce qu'un système ASR a le plus de mal à restituer correctement, car ils ne suivent pas les distributions du dictionnaire. Il arrive qu'un nom soit rendu de façon phonétiquement étrange. La couche de traduction laisse généralement les noms propres non traduits, ce qui est le comportement correct — « Guillermo » doit rester « Guillermo » en anglais, et non devenir « William ». Pour les noms critiques (rendez-vous médicaux, conversations juridiques), il est utile de taper ou de montrer le nom par écrit une fois. Vous pouvez également ajouter des noms comme termes clés depuis le menu — Scribe v2 prend en charge l'invite par termes clés, ce qui oriente le moteur vers la reconnaissance des noms que vous lui avez indiqués.

Termes culturels « intraduisibles ». Des mots comme Schadenfreude, saudade, hygge ou giri n'ont pas d'équivalents exacts en un seul mot en français. Gemini 2.5 va soit translittérer (conserver le mot original) soit paraphraser (p. ex. « un sentiment douillet de bien-être » pour hygge). Les paraphrases peuvent être longues — il arrive qu'un seul mot dans la langue source produise une proposition entière dans la langue cible. Il s'agit d'un comportement attendu, pas d'un bug.

Jargon technique et vocabulaire spécialisé. Les termes médicaux, juridiques et les noms de produits sont généralement bien gérés par le traducteur, mais peuvent poser problème à l'ASR pour les langues des niveaux de précision Bon ou En développement. Si vous utilisez l'application pour une conversation spécialisée dans une langue moins répandue, attendez-vous à des transcriptions occasionnellement imprécises sur les termes spécialisés — et pour tout ce qui est véritablement critique pour la sécurité, un interprète humain reste la bonne solution.

Foyers multilingues. Pour les familles bilingues où une personne parle une langue et une autre répond dans une langue différente, l'architecture à deux flux de Live Translate Live gère cela nativement — le côté de la conversation de chaque locuteur est traduit vers la langue de l'autre, quel que soit le moment où chacun parle.

Dans toutes les directions

La plupart des applications de traduction ne traduisent que vers et depuis l'anglais. Live Translate Live est différent — il prend en charge la traduction dans toutes les directions entre les 103 langues. Cela signifie que vous pouvez traduire directement entre le japonais et le français, l'arabe et le coréen, le hindi et le portugais, le vietnamien et le polonais, ou toute autre combinaison. Aucun intermédiaire anglais n'est requis.

Avec 103 langues et un appariement dans toutes les directions, vous obtenez 10 506 paires de langues uniques. Les deux côtés de la conversation sont traduits simultanément avec une traduction bidirectionnelle, de sorte qu'aucun des locuteurs n'a à attendre.

Voix IA en direct dans 74 langues (mode Audio)

En plus du défilement marquee, le mode Audio lit la phrase traduite à voix haute via le haut-parleur de votre appareil en utilisant ElevenLabs v3 (avec Flash v2.5 comme alternative plus rapide pour les langues qu'il couvre). 74 des 103 langues prises en charge disposent aujourd'hui d'une lecture vocale par IA ; les autres fonctionnent toujours en mode Audio, vous voyez simplement le texte traduit à l'écran sans lecture orale.

Le mode Audio est l'outil adapté lorsque la lecture d'un affichage défilant n'est pas pratique — marchés, taxis, salles d'attente d'hôpitaux, partout où vous passeriez naturellement le téléphone d'une main à l'autre. L'analyse approfondie se trouve dans notre article sur le mode Audio.

Paires de langues populaires

Bien que toutes les combinaisons fonctionnent, voici quelques-unes des paires les plus utilisées sur Live Translate Live :

Vous ne voyez pas votre paire dans la liste ? Si les deux langues figurent dans la liste prise en charge ci-dessus, elles fonctionnent ensemble — les 10 506 combinaisons sont entièrement prises en charge.

Foire aux questions

Gère-t-il les accents ?

Oui, sur une large plage. Scribe v2 est entraîné sur des données d'accent diversifiées, et l'anglais en particulier gère proprement les accents américain, britannique, australien, indien et sud-africain. Pour les autres langues, les accents régionaux prononcés au sein d'un pays (dialectes ruraux épais, par exemple) afficheront des taux d'erreur légèrement plus élevés que la parole d'un présentateur de journal télévisé, mais la tendance générale en 2026 est que l'ASR moderne est nettement moins sensible aux accents que les anciens systèmes. Si un locuteur spécifique obtient une mauvaise reconnaissance, la correction la plus efficace est généralement une meilleure position du microphone plutôt qu'un changement de paramètre de langue.

Que se passe-t-il si un mot n'existe pas dans la langue cible ?

Gemini 2.5 va soit translittérer (conserver le mot original, parfois rendu dans le script de la langue cible) soit paraphraser (utiliser une courte phrase qui capture le sens). Pour les emprunts déjà courants dans la langue cible — « computer », « taxi », « sushi » — il les laisse simplement passer. Pour les mots véritablement spécifiques à une culture sans équivalent direct, attendez-vous à une paraphrase. Aucun des deux cas ne rompt la conversation ; vous obtenez simplement parfois une phrase légèrement plus longue que celle produite par le locuteur.

Les deux locuteurs doivent-ils utiliser le même navigateur ?

Non. Live Translate Live est une application à écran unique — la configuration habituelle est deux personnes sur un seul appareil, soit assis côte à côte, soit en utilisant le mode vis-à-vis pour lire l'affichage depuis les côtés opposés d'une table. Aucune connexion séparée ni installation d'application n'est requise pour le second locuteur ; il suffit qu'il soit à portée du microphone. Pour les configurations à travers une pièce ou sur un téléviseur, l'affichage peut être diffusé ou ouvert sur un écran séparé.

Puis-je changer de langue en cours de conversation ?

Oui. Le sélecteur de langue est actif — vous pouvez modifier la langue de l'un ou l'autre côté à tout moment sans mettre fin à la session. Cela est utile lorsqu'une troisième personne rejoint une conversation dans une langue différente, ou lorsqu'un locuteur bilingue passe d'une langue à une autre en cours de route. Les crédits continuent sans interruption lors du changement.

Essayez-le avec votre paire de langues

Choisissez vos deux langues et démarrez une conversation bilingue en temps réel en quelques secondes. Live Translate Live fonctionne dans votre navigateur — aucune application à télécharger. Les deux locuteurs voient un affichage de traduction défilant avec des traductions en direct pendant qu'ils parlent, ou vous pouvez passer au mode Audio pour une utilisation en main propre avec lecture vocale par IA.

Les crédits de traduction commencent à seulement 1 $ pour 15 minutes. Aucun abonnement requis.

Commencer à traduire · Mode Audio · Référence complète des langues · Voir les tarifs


Essayez Live Translate Live

Commencez à traduire des conversations bilingues en temps réel dès aujourd'hui.

Commencer gratuitement