103 idiomas compatibles con traducción en tiempo real — En cualquier dirección

Actualizado en mayo de 2026

¿Buscas una aplicación de traducción en tiempo real que sea compatible con tu par de idiomas? Live Translate Live admite 103 idiomas con traducción bidireccional simultánea en cualquier dirección. Eso son 10 506 combinaciones de idiomas posibles — todas con traducción en desplazamiento en pantalla y reproducción de voz con IA en 74 de ellas. La referencia canónica completa (con niveles de precisión por idioma) se encuentra en /languages; esta publicación recorre la lista y explica qué esperar de los distintos pares de idiomas.

Lista completa de idiomas compatibles

Todos los idiomas que aparecen a continuación funcionan tanto como idioma de origen como de destino. Elige cualquier par y comienza una conversación bilingüe con traducción en tiempo real.

  • Afrikáans
  • Albanés
  • Amhárico
  • Árabe
  • Armenio
  • Asamés
  • Azerbaiyano
  • Baskir
  • Vasco
  • Bielorruso
  • Bengalí
  • Bosnio
  • Bretón
  • Búlgaro
  • Birmano
  • Catalán
  • Chino (mandarín)
  • Chino (tradicional)
  • Croata
  • Checo
  • Danés
  • Neerlandés
  • Inglés
  • Estonio
  • Feroés
  • Filipino
  • Finés
  • Francés
  • Francés (Canadá)
  • Gallego
  • Georgiano
  • Alemán
  • Griego
  • Gujarati
  • Criollo haitiano
  • Hausa
  • Hawaiano
  • Hebreo
  • Hindi
  • Húngaro
  • Islandés
  • Indonesio
  • Italiano
  • Japonés
  • Javanés
  • Canarés
  • Kazajo
  • Jemer
  • Coreano
  • Lao
  • Latín
  • Letón
  • Lingala
  • Lituano
  • Luxemburgués
  • Macedonio
  • Malgache
  • Malayo
  • Malabar
  • Maltés
  • Māori
  • Marathi
  • Mongol
  • Nepalés
  • Noruego
  • Noruego nynorsk
  • Occitano
  • Pastún
  • Persa
  • Polaco
  • Portugués
  • Portugués (Portugal)
  • Punjabi
  • Rumano
  • Ruso
  • Sánscrito
  • Serbio
  • Shona
  • Sindhi
  • Cingalés
  • Eslovaco
  • Esloveno
  • Somalí
  • Español
  • Sundanés
  • Suajili
  • Sueco
  • Tagalo
  • Tayiko
  • Tamil
  • Tártaro
  • Telugu
  • Tailandés
  • Tibetano
  • Turco
  • Turcomano
  • Ucraniano
  • Urdu
  • Uzbeko
  • Vietnamita
  • Galés
  • Yídish
  • Yoruba

Reconocimiento de voz vs. traducción: dos capas distintas

Algo que vale la pena entender si estás comparando herramientas: la “compatibilidad de idiomas” en una aplicación de traducción en vivo son en realidad dos cosas distintas apiladas una sobre la otra. Primero, la aplicación tiene que reconocer lo que dijiste (voz a texto, o ASR). Luego tiene que traducir ese texto al otro idioma (traducción automática, o MT). Son sistemas separados con coberturas separadas.

Live Translate Live usa ElevenLabs Scribe v2 Realtime para el reconocimiento de voz y Google Gemini 2.5 para la traducción. La lista de 103 idiomas anterior es lo que transmite Scribe v2; Gemini 2.5 cubre todos esos y muchos más en el lado de la traducción de texto. El factor limitante para la traducción de voz en vivo es casi siempre la capa ASR, no la capa de traducción.

Por eso un idioma puede aparecer en la interfaz de texto de Google Translate pero no en una aplicación de voz en vivo. La traducción de texto solo necesita la capa MT. La traducción de voz en vivo necesita que ambas capas funcionen en milisegundos, sobre una transmisión de audio en tiempo real, con el acento y el ruido de fondo que el micrófono capte. Cuando un idioma cae por debajo de la calidad de ASR en streaming utilizable, preferimos no incluirlo antes que ofrecer algo que transcriba mal la mitad de la conversación.

ElevenLabs publica una cuadrícula de tasa de error de palabras (WER) de cuatro niveles para Scribe v2 — Excelente (≤5%), Alto (5–10%), Bueno (10–15%) y En desarrollo (15%+). Mostramos esos niveles como puntos de colores junto a cada idioma en el selector de la aplicación, y el desglose completo está en /languages. La nueva publicación del anuncio de lanzamiento cubre el cambio de motor y qué cambió para los usuarios.

Idiomas y variantes regionales

Muchos de los 103 idiomas anteriores tienen múltiples dialectos regionales. Algunos se gestionan como un único modelo, otros tienen variantes por región que puedes seleccionar, y algunas grandes familias lingüísticas se reducen a una variante dominante en la capa ASR. Así es como se desglosan las más comunes.

Idioma Variantes regionales Notas
Español Modelo único (gestiona el español ibérico y el latinoamericano) Scribe gestiona ambas variedades regionales con precisión en un solo modelo. Las diferencias de vocabulario regional (p. ej., coche vs carro) se conservan en la transcripción y el traductor las maneja correctamente hacia otros idiomas.
Portugués pt (brasileño por defecto), pt-PT (europeo) El portugués brasileño domina los datos de entrenamiento y se transcribe de forma muy fiable. El portugués europeo es una variante seleccionable; útil para usuarios en Portugal o con hablantes africanos lusófonos.
Francés fr (por defecto), fr-CA (Quebec) El francés de Quebec es una variante seleccionable. El modelo por defecto gestiona fr-FR, fr-BE y fr-CH correctamente; el argot regional muy marcado de Quebec puede normalizarse ocasionalmente hacia el francés estándar en la transcripción a menos que selecciones la variante fr-CA.
Inglés Modelo único (acentos de EE. UU., Reino Unido, Australia, India, Nueva Zelanda, Sudáfrica) El idioma con mayor entrenamiento, con excelente cobertura de los principales acentos. El inglés indio, en particular, está bien gestionado.
Chino Mandarín (zh), tradicional (zh-TW); cantonés como entrada propia El mandarín es el objetivo hablado principal. El cantonés está disponible como idioma propio en el selector. Los caracteres simplificados y tradicionales se muestran correctamente en el lado de la traducción.
Árabe Árabe estándar moderno (principal) El árabe está disponible, pero el manejo de dialectos varía. El árabe estándar moderno funciona mejor. Los dialectos egipcio, del Golfo, levantino y magrebí se transcriben con precisión variable — el habla dialectal coloquial es el caso más difícil de todo el conjunto de idiomas.
Hindi / Urdu hi, ur Lingüísticamente muy cercanos a nivel hablado, pero escritos en diferentes alfabetos (devanagari vs. nastaliq). Ambos están disponibles como objetivos ASR separados.
Noruego no (Bokmål), nn (Nynorsk) El bokmål es el predeterminado. El nynorsk es una variante seleccionable para hablantes de esa norma escrita.
Serbio / Croata / Bosnio Modelos separados por idioma Mutuamente inteligibles a nivel hablado, pero tratados como tres idiomas separados con sus propios alfabetos y normas. El serbio admite salida tanto en alfabeto cirílico como latino.

Cuando el selector ofrece una variante regional específica, elegir la que corresponde al hablante suele mejorar la precisión de la transcripción de forma notable — especialmente para el portugués y el francés.

Qué pares de idiomas funcionan mejor

Los 10 506 pares funcionan, pero no todos se sienten igual. Tres factores determinan la experiencia real de un par dado:

Los pares que se sienten más rápidos y fluidos en la práctica:

Pares que funcionan bien pero muestran más “reflexión” visible antes de que aparezca cada oración:

Qué significa realmente “en tiempo real”

“Tiempo real” es una expresión imprecisa, así que esto es lo que significa en la práctica. Mientras hablas, las palabras empiezan a aparecer en pantalla casi de inmediato — texto provisional que se consolida a medida que el reconocedor escucha más de la oración. ElevenLabs publica una latencia de streaming de ~150 ms para Scribe v2, y la mayoría de las palabras aparecen en ~400–800 ms desde que se pronuncian.

La traducción se activa una vez que se finaliza cada oración. Gemini 2.5 devuelve una traducción en pocos cientos de milisegundos, con la ventaja de que ve los turnos anteriores y mantiene el contexto conversacional a lo largo de ellos. La latencia de extremo a extremo desde que “el hablante termina una oración” hasta que “el oyente ve la traducción” suele ser inferior a un segundo.

Por eso importa el orden de las palabras: el reconocedor mostrará con gusto texto provisional mientras hablas, pero el traductor necesita una cláusula coherente con la que trabajar. En inglés ↔ español, ese límite de cláusula aparece aproximadamente en el mismo lugar en ambos idiomas. En inglés ↔ japonés, no — por eso las traducciones al japonés aparecen en fragmentos ligeramente más grandes que las del español.

Casos límite: dialectos, alfabetos y nombres

Una conversación en vivo rara vez se mantiene dentro de los límites precisos de un único idioma. Vale la pena mencionar algunos casos límite porque surgen con frecuencia.

Cambio de código. Los hablantes bilingües a menudo mezclan idiomas a mitad de oración — spanglish, hinglish, franglais. La aplicación lo gestiona con elegancia la mayor parte del tiempo, colocando cada idioma en el lado correcto de la pantalla incluso cuando un hablante cambia a mitad de enunciado. Para el cambio de código predecible, sigue siendo útil mantener un idioma asignado por hablante; para palabras ocasionales, la capa de traducción suele perdonar pequeñas imprecisiones en la transcripción.

Nombres propios. Los nombres de personas, empresas y lugares son lo más difícil de acertar para un sistema ASR porque no siguen distribuciones de diccionario. Ocasionalmente verás un nombre con una transcripción fonética extraña. La capa de traducción normalmente deja los nombres propios sin traducir, que es el comportamiento correcto — “Guillermo” debe seguir siendo “Guillermo” en inglés, no convertirse en “William”. Para nombres críticos (citas médicas, conversaciones legales), ayuda también escribir o mostrar el nombre por escrito una vez. También puedes añadir nombres como términos clave desde el menú — Scribe v2 admite la sugerencia de términos clave, lo que orienta el motor hacia el reconocimiento de los nombres que le has indicado.

Términos culturales “intraducibles”. Palabras como Schadenfreude, saudade, hygge o giri no tienen equivalentes directos de una sola palabra en español. Gemini 2.5 los transliterará (conservará la palabra original) o los parafraseará (p. ej., “una sensación acogedora de bienestar” para hygge). Las paráfrasis pueden ser largas — ocasionalmente una sola palabra en el idioma de origen produce una cláusula en el idioma de destino. Este es el comportamiento esperado, no un error.

Jerga técnica y vocabulario especializado. Los términos médicos, legales y los nombres de productos generalmente están bien gestionados por el traductor, pero pueden confundir al ASR en idiomas de los niveles de precisión Bueno o En desarrollo. Si usas la aplicación para una conversación especializada en un idioma menos común, espera transcripciones ocasionalmente imprecisas en términos especializados — y para cualquier cosa verdaderamente crítica para la seguridad, un intérprete humano sigue siendo la opción correcta.

Hogares multilingües. Para familias bilingües donde una persona habla un idioma y otra responde en uno diferente, la arquitectura de dos flujos de Live Translate Live gestiona esto de forma nativa — el lado de la conversación de cada hablante se traduce al idioma del otro, independientemente de quién esté hablando en cada momento.

En cualquier dirección

La mayoría de las aplicaciones de traducción solo traducen hacia y desde el inglés. Live Translate Live es diferente — admite traducción de cualquier idioma a cualquier otro entre los 103 idiomas. Eso significa que puedes traducir directamente entre japonés y francés, árabe y coreano, hindi y portugués, vietnamita y polaco, o cualquier otra combinación. No se requiere el inglés como intermediario.

Con 103 idiomas y emparejamiento en cualquier dirección, obtienes 10 506 pares de idiomas únicos. Ambos lados de la conversación se traducen simultáneamente con traducción bidireccional, para que ningún hablante tenga que esperar.

Voz con IA en vivo en 74 idiomas (modo de audio)

Además del marquee de desplazamiento, el modo de audio reproduce la oración traducida en voz alta a través del altavoz de tu dispositivo usando ElevenLabs v3 (con Flash v2.5 como alternativa más rápida para los idiomas que cubre). 74 de los 103 idiomas compatibles tienen reproducción de voz con IA hoy; el resto sigue funcionando en el modo de audio, simplemente ves el texto traducido en pantalla sin reproducción hablada.

El modo de audio es la herramienta adecuada cuando leer una pantalla en desplazamiento no es práctico — mercados, taxis, salas de espera de hospitales, cualquier lugar donde naturalmente pasarías el teléfono de mano en mano. El análisis detallado está en nuestra publicación sobre el modo de audio.

Pares de idiomas populares

Aunque todas las combinaciones funcionan, estos son algunos de los pares más utilizados en Live Translate Live:

¿No ves tu par en la lista? Si ambos idiomas están en la lista de compatibles anterior, funcionan juntos — las 10 506 combinaciones están totalmente disponibles.

Preguntas frecuentes

¿Gestiona los acentos?

Sí, en un amplio rango. Scribe v2 está entrenado con datos de acentos diversos, y el inglés en particular gestiona correctamente los acentos de EE. UU., Reino Unido, Australia, India y Sudáfrica. Para otros idiomas, los acentos regionales muy marcados dentro de un país (dialectos rurales pronunciados, por ejemplo) tendrán tasas de error ligeramente más altas que el habla de un locutor de noticias, pero la tendencia general en 2026 es que el ASR moderno es notablemente menos sensible a los acentos que los sistemas más antiguos. Si un hablante específico está obteniendo un reconocimiento deficiente, la solución más eficaz suele ser una mejor posición del micrófono en lugar de cambiar la configuración de idioma.

¿Qué pasa si una palabra no existe en el idioma de destino?

Gemini 2.5 la transliterará (conservará la palabra original, a veces representada en el alfabeto del idioma de destino) o la parafraseará (usará una frase corta que capture el significado). Para los préstamos lingüísticos que ya son comunes en el idioma de destino — “computer”, “taxi”, “sushi” — simplemente los deja pasar. Para palabras genuinamente específicas de una cultura sin equivalente directo, espera una paráfrasis. Ninguno de los casos interrumpe la conversación; simplemente obtienes ocasionalmente una oración ligeramente más larga que la que produjo el hablante.

¿Tienen que usar ambos hablantes el mismo navegador?

No. Live Translate Live es una aplicación de pantalla única — la configuración habitual es dos personas en un dispositivo, ya sea sentadas una al lado de la otra o usando el modo vis-à-vis para leer la pantalla desde lados opuestos de una mesa. No se requiere inicio de sesión separado ni instalación de aplicación para el segundo hablante; solo necesita estar al alcance del micrófono. Para configuraciones a distancia o en un televisor, la pantalla puede transmitirse o abrirse en una pantalla separada.

¿Puedo cambiar de idioma a mitad de conversación?

Sí. El selector de idioma está activo — puedes cambiar el idioma de cualquiera de los lados en cualquier momento sin terminar la sesión. Esto es útil cuando una tercera persona se une a una conversación en un idioma diferente, o cuando un hablante bilingüe cambia de un idioma a otro a mitad de camino. Los créditos continúan sin interrupción durante el cambio.

Pruébalo con tu par de idiomas

Elige tus dos idiomas y comienza una conversación bilingüe en tiempo real en segundos. Live Translate Live funciona en tu navegador — sin aplicación que descargar. Ambos hablantes ven una pantalla de traducción en desplazamiento con traducciones en vivo mientras hablan, o puedes cambiar al modo de audio para uso individual con reproducción de voz con IA.

Los créditos de traducción comienzan desde solo $1 por 15 minutos. Sin suscripción requerida.

Comenzar a traducir · Modo de audio · Referencia completa de idiomas · Ver precios


Prueba Live Translate Live

Empieza a traducir conversaciones bilingües en tiempo real hoy mismo.

Comenzar Gratis