Idiomas compatibles

Live Translate Live admite 103 idiomas para el reconocimiento de voz en tiempo real, 74 con reproducción de voz IA en directo en el modo Audio, y traducción de cualquier idioma a cualquier otro entre los 103 — es decir, 10 506 pares de idiomas únicos en el marquee. Esta página es la referencia canónica: qué idiomas son compatibles, con qué precisión se reconoce cada uno y dónde está disponible la voz IA.

Niveles de precisión del reconocimiento de voz

Usamos ElevenLabs Scribe v2 Realtime para el reconocimiento de voz en directo. ElevenLabs publica referencias de tasa de error de palabras (WER) para Scribe en todos sus idiomas compatibles, agrupados en cuatro niveles. Un WER más bajo significa que más palabras se reconocen correctamente. Los niveles que se muestran a continuación son las referencias publicadas; en una conversación real, la calidad del micrófono y el ruido ambiental importan más que la diferencia entre los dos niveles superiores.

Nivel WER Idiomas
Excelente ≤ 5% Bielorruso, Bosnio, Búlgaro, Catalán, Croata, Checo, Danés, Neerlandés, Inglés, Estonio, Finlandés, Francés, Gallego, Alemán, Griego, Húngaro, Islandés, Indonesio, Italiano, Japonés, Canarés, Letón, Macedonio, Malayo, Malabar, Noruego, Polaco, Portugués, Rumano, Ruso, Eslovaco, Español, Sueco, Turco, Ucraniano, Vietnamita (36)
Alto 5–10% Armenio, Azerbaiyano, Bengalí, Cantonés, Filipino, Georgiano, Gujarati, Hindi, Kazajo, Lituano, Maltés, Chino mandarín, Marathi, Nepalés, Odia, Persa, Serbio, Esloveno, Suajili, Tamil, Telugu (21)
Bueno 10–15% Afrikáans, Árabe, Asamés, Asturiano, Birmano, Hausa, Hebreo, Javanés, Coreano, Kirguís, Luxemburgués, Māori, Occitano, Punjabi, Tayiko, Tailandés, Uzbeko, Galés (18)
En desarrollo 15%+ Amhárico, Ganda, Igbo, Irlandés, Jemer, Kurdo, Lao, Mongol, Sotho del Norte, Pastún, Shona, Sindhi, Somalí, Urdu, Wolof, Xhosa, Yoruba, Zulú (18)

Los rangos de WER y las agrupaciones de idiomas se basan en las referencias publicadas por ElevenLabs para Scribe v2. Los puntos de nivel aparecen junto a cada idioma en el selector de idiomas de la aplicación para que puedas ver de un vistazo qué esperar. La referencia cubre unos 93 idiomas; nuestra aplicación admite un pequeño conjunto adicional (Baskir, Vasco, Bretón, Feroés, Criollo haitiano, Hawaiano, Latín, Lingala, Malgache, Sánscrito, Cingalés, Albanés, Sundanés, Tártaro, Turcomano, Yídish, Tibetano) que Scribe gestiona pero para los que ElevenLabs no ha publicado un nivel de WER — estos aparecen en el selector sin punto de nivel y funcionan en conversación; simplemente no tenemos un número de precisión oficial que asignarles.

Voz IA en directo (modo Audio)

El modo Audio reproduce la frase traducida en voz alta a través del altavoz de tu dispositivo. La voz es generada por ElevenLabs v3 (con Flash v2.5 como alternativa más rápida para los idiomas que cubre). Cuando un idioma no está en ninguno de los dos modelos TTS, el modo Audio sigue funcionando — verás el texto traducido en pantalla, simplemente sin reproducción de voz.

74 idiomas tienen reproducción de voz en directo hoy. ElevenLabs amplía esta lista periódicamente, y la aplicación obtiene la lista de cobertura actual de la API al iniciarse — así que cuando v3 crezca, tu modo Audio crecerá con él automáticamente.

En el selector de idiomas de la página de Audio, el menú desplegable «Su idioma» se filtra automáticamente a los idiomas que admiten reproducción de voz. El selector del marquee muestra los 103 porque la pantalla de desplazamiento no necesita TTS.

Traducción entre los 103 idiomas

La traducción funciona con Google Gemini 2.5. Cada idioma reconocido por Scribe puede traducirse hacia y desde cualquier otro — sin necesidad de un intermediario en inglés. Puedes hablar en japonés y que llegue en portugués, o en hindi a árabe, o en coreano a suajili. Con 103 idiomas de origen y destino, eso son 10 506 pares únicos.

Gemini 2.5 mantiene el contexto conversacional a lo largo de los turnos. Pronombres, concordancia de género, expresiones idiomáticas — el traductor ve lo que se dijo anteriormente y traduce el siguiente turno teniendo ese contexto en cuenta. Esto importa más de lo que la gente cree: una sola frase traducida de forma aislada es aproximadamente un orden de magnitud más difícil de traducir de forma natural que una frase traducida como parte de una conversación en curso.

Variantes regionales

Muchos de los 103 idiomas anteriores tienen múltiples dialectos regionales. Algunos se gestionan como un único modelo, otros tienen variantes por región que puedes seleccionar, y algunas familias lingüísticas se reducen a una variante dominante en la capa de reconocimiento de voz.

Idioma Variantes regionales Notas
Francés fr (predeterminado), fr-CA (Quebec) El francés de Quebec es una variante seleccionable en el selector — útil cuando uno de los hablantes es québécois y el vocabulario regional importa.
Portugués pt (brasileño predeterminado), pt-PT (europeo) El portugués brasileño domina los datos de entrenamiento. El portugués europeo es una variante seleccionable para usuarios en Portugal o con hablantes africanos lusófonos.
Chino zh (mandarín, simplificado), zh-TW (tradicional) El mandarín es el objetivo hablado principal. El cantonés también es compatible como entrada propia en el nivel Alto. Los caracteres tradicionales y simplificados se muestran en el lado de la traducción.
Español Modelo único (gestiona el ibérico y el latinoamericano) Scribe gestiona ambas variedades regionales de forma limpia en un solo modelo. El traductor preserva las diferencias de vocabulario regional (coche vs carro) en la transcripción y las representa adecuadamente en los idiomas de destino.
Inglés Modelo único (acentos de EE. UU., Reino Unido, Australia, India, Nueva Zelanda, Sudáfrica) El idioma con mayor entrenamiento, con una sólida cobertura de acentos. El inglés indio en particular está bien gestionado.
Árabe Árabe estándar moderno (principal) El árabe estándar moderno funciona mejor. Los dialectos egipcio, del Golfo, levantino y magrebí se transcriben con precisión variable — el habla dialectal coloquial es el caso más difícil de todo el conjunto de idiomas.
Hindi / Urdu hi, ur Lingüísticamente muy cercanos a nivel hablado, pero escritos en diferentes alfabetos (Devanagari vs Nastaliq). Ambos son compatibles como objetivos ASR independientes.
Noruego no, nn (Nynorsk) El Bokmål es el predeterminado. El Nynorsk es seleccionable para hablantes de esa norma escrita.
Serbio / Croata / Bosnio Entradas separadas por idioma Mutuamente inteligibles a nivel hablado, pero tratados como tres idiomas distintos con sus propios alfabetos y normas.

Cuando hay una variante regional disponible en el selector, elegir la que corresponde al hablante suele mejorar notablemente la precisión de la transcripción — especialmente en portugués y francés.

Conversación bidireccional

En una conversación bidireccional, la aplicación mantiene las palabras de cada hablante en su propio lado de la pantalla. El marquee casi nunca coloca las palabras del hablante equivocado en el lado incorrecto; los casos más difíciles en la práctica son los enunciados extremadamente cortos («OK», «mmm», nombres propios aislados) y el cambio de código cuando un hablante bilingüe cambia de idioma a mitad de frase. Ambos idiomas se traducen simultáneamente, por lo que ningún hablante tiene que esperar a que el otro termine.

Pruébalo

Elige tus dos idiomas e inicia una conversación bilingüe en tiempo real. Sin aplicación que descargar — todo funciona en el navegador. Los créditos de traducción comienzan en $1 por 15 minutos; la transcripción en el modo Audio es gratuita hasta que pulsas Traducir.

Empezar en el marquee · Probar el modo Audio · Ver precios · Ver todas las funciones

¿Quieres conocer los detalles de cómo llegamos hasta aquí? Lee por qué cambiamos de motor o el anuncio del lanzamiento con 103 idiomas.