Modo de mismo idioma — Transcripción en tiempo real a un costo 10 veces menor
Marzo 2026
Live Translate Live está diseñado para la traducción en tiempo real entre dos idiomas, pero el mismo motor resuelve un problema diferente casi por accidente. Establece el idioma de origen y el idioma de destino con el mismo valor y la aplicación cambia al modo de transcripción en el mismo idioma: un único marquesina de desplazamiento a pantalla completa que muestra subtítulos de voz a texto en vivo sin ningún paso de traducción. Los créditos se consumen 10 veces más lento, la pantalla se hace más grande y la herramienta se convierte silenciosamente en uno de los sistemas de subtitulado en vivo más económicos que puedes ejecutar en un navegador.
La mayoría de las personas lo descubren de la misma manera. Se registran para traducir algo — una visita de familiares, una cita médica, una transmisión — y luego se dan cuenta de que el problema más persistente en su vida es que alguien en la habitación no puede escuchar el televisor. O la reunión. O el orador al frente de la sala. El modo de mismo idioma era la respuesta que se escondía en la configuración todo el tiempo.
El momento en que todo encaja
Un usuario escribió recientemente con una descripción sencilla: "Mi madre tiene pérdida auditiva. Vemos misterios británicos juntos y los acentos más la música hacen que se pierda la mitad de cada episodio. Los subtítulos integrados del televisor están bien para los programas que los tienen, pero mucho de lo que vemos se transmite desde fuentes que no subtitulan de forma fiable, o los subtítulos se retrasan, o están en el idioma equivocado." Apoyó su teléfono junto al televisor, configuró ambos idiomas en inglés y dejó que la marquesina desplazara subtítulos en vivo debajo de la imagen. Su madre puede seguir el hilo de nuevo. Ese es el caso de uso en un párrafo.
Es el mismo patrón una y otra vez: alguien necesita subtítulos para un discurso que no está siendo subtitulado por nada más. Un abuelo escuchando a un nieto leer un ensayo escolar. Un gerente dirigiendo una reunión de personal donde un empleado tiene un trastorno de procesamiento auditivo. Un pastor cuya congregación incluye varios miembros con dificultades auditivas. Una charla en una conferencia donde el acento del orador es difícil de entender. Nada de esto es un problema de traducción, pero sí es un problema de voz a texto en tiempo real, y eso es exactamente lo que hace el pipeline de traducción antes de traducir cualquier cosa.
Cómo activar el modo de mismo idioma
No hay nada adicional que instalar o configurar. Abre Live Translate Live y establece tanto el menú desplegable "Tu idioma" como el de "Su idioma" con el mismo idioma — por ejemplo, ambos en español. Eso es todo. La aplicación detecta automáticamente la coincidencia y cambia al modo de solo transcripción.
Cuando el modo de mismo idioma está activo, la marquesina cambia de una pantalla dividida en dos filas a un único panel de altura completa. Solo tu transcripción de voz a texto se desplaza por la pantalla — sin fila de traducción, sin diseño dividido, solo un flujo limpio de subtítulos aproximadamente al doble del tamaño vertical. En un televisor o proyector, esa diferencia es la diferencia entre "legible" y "legible desde el sofá."
Matemáticas de créditos — Por qué es 10 veces más barato
El modo de traducción ejecuta dos pipelines completos de reconocimiento de voz (uno para cada hablante) más una llamada a Google Cloud Translation por cada frase. El modo de mismo idioma elimina por completo la llamada de traducción y se reduce a un único paso de reconocimiento de voz. Nuestra facturación refleja eso: el modo de traducción cobra 1 crédito por segundo, el modo de mismo idioma cobra 1 crédito por cada 10 segundos. Diez veces más tiempo con el mismo presupuesto.
En dólares, los mismos paquetes de créditos cubren tiempos de ejecución dramáticamente diferentes según el modo en que estés:
| Modo | Créditos / segundo | $1 (900 créditos) | $3 (~11 000 créditos) | Ideal para |
|---|---|---|---|---|
| Traducción | 1 / seg | ~15 minutos | ~3 horas | Dos hablantes, idiomas diferentes |
| Mismo idioma | 1 / 10 seg | ~2,5 horas | ~30 horas | Subtítulos, accesibilidad, transcripción |
Los créditos se facturan solo mientras el audio está siendo transcrito activamente — los silencios y las sesiones en pausa no consumen créditos. El tiempo de ejecución real varía según la continuidad del habla. Consulta precios para ver la lista completa de paquetes de créditos.
Un dólar te da toda una tarde de televisión con subtítulos. Tres dólares te dan casi una semana laboral completa de subtítulos en Zoom. El precio sigue siendo de pago por uso y los créditos no caducan, por lo que el mismo paquete que financia un año de sesiones ocasionales de subtitulado también cubre la conversación de traducción ocasional cuando la necesitas.
Casos de uso — Quién lo usa realmente
La lista de casos de uso comenzó siendo pequeña y sigue creciendo. Algunos patrones han surgido con suficiente claridad como para describirlos en detalle:
Accesibilidad en el hogar
Este es el grupo más grande. Un familiar con pérdida auditiva, un hogar que quiere subtítulos para servicios de streaming que no subtitulan bien, o una versión visualmente reforzada de una conversación en una cocina ruidosa donde el lavavajillas está en marcha. La configuración es casi siempre la misma: un teléfono o tableta en un soporte junto (o debajo) del televisor, apuntando a los altavoces del televisor, con ambos idiomas configurados con el mismo valor y la marquesina llenando la pantalla. Los créditos duran lo suficiente como para olvidar que está funcionando.
Una variante: subtitular contenido en un idioma extranjero de vuelta a su idioma original. ¿Viendo una película francesa con el audio original en francés? El modo de mismo idioma configurado en francés te da subtítulos en francés en vivo incluso cuando el servicio de streaming solo ofrece subtítulos en inglés. No es un sustituto de los subtítulos elaborados profesionalmente, pero para contenido sin guion o poco común a menudo supera la alternativa de no tener nada.
Zoom, Google Meet y otras reuniones
Google Meet tiene subtítulos. Zoom tiene subtítulos. Teams tiene subtítulos. Todos son bastante buenos. Lo que no hacen es aparecer en una segunda pantalla donde puedas leer mientras tomas notas a mano, o donde un colega con pérdida auditiva pueda verlos sin luchar contra el encuadre del hablante activo de la llamada. El modo de mismo idioma ejecutándose en una tableta junto a tu portátil resuelve eso — y también capta el audio de los altavoces externos que el sistema de subtítulos de la plataforma a menudo pierde (alguien en altavoz al otro lado de la sala de conferencias, un participante remoto cuyo audio se reproduce a través de un altavoz Bluetooth).
Ejecutar subtítulos durante una reunión también es una ayuda sorprendentemente eficaz para tomar notas. Cuando alguien dice "la QBR está programada para el Q3 y el SLA para eso es 99,95" y los subtítulos te muestran las palabras tal como las escuchaste, es mucho más fácil incluir los acrónimos correctos en tus propias notas. El historial de conversaciones en tu cuenta guarda la transcripción completa para consultarla más tarde.
Eventos en vivo y lugares de culto
El modo de mismo idioma en una pantalla grande — un proyector, un televisor montado en la pared, un monitor dedicado al fondo de la sala — convierte la aplicación en un sistema ligero de subtitulado en vivo. Una iglesia que celebra un servicio dominical puede tener el sermón desplazándose en tiempo real para los feligreses con dificultades auditivas. Una conferencia puede poner subtítulos en una pantalla lateral. Una reunión de junta puede subtitular las observaciones del presidente para los oyentes distantes. El precio hace esto viable para organizaciones pequeñas que no podrían permitirse un servicio CART dedicado — $3 cubre un mes de servicios semanales de dos horas con margen de sobra.
Transmisión en OBS
El modo de mismo idioma funciona perfectamente como fuente de navegador en OBS. Consulta la guía de configuración de OBS + smart TV para el recorrido completo — la versión corta es que la URL de la marquesina independiente se puede agregar como fuente de navegador igual que cualquier otra superposición, y con ambos idiomas configurados con el mismo valor obtienes una cinta de subtítulos limpia para una transmisión en inglés (o español, o japonés). El diseño de una sola fila deja más espacio vertical para tu feed de juego o cámara web, y la tasa de créditos 10x significa que una transmisión de varias horas cuesta centavos.
Refuerzo de acento y terminología
El modo de mismo idioma es genuinamente útil para situaciones en las que el discurso está en un idioma que conoces pero que aún requiere esfuerzo para seguir — una charla de conferencia con un acento marcado, una conferencia técnica repleta de jerga desconocida, una conversación médica o legal donde las palabras exactas importan. Ver la forma escrita junto a la forma hablada capta cosas que el oído pasaría por alto: nombres propios, nombres de medicamentos, números de estatutos, acrónimos. Los asistentes de habla inglesa en una conferencia en inglés a menudo encuentran los subtítulos más útiles que los subtítulos traducidos, porque el cuello de botella no es el idioma, sino la densidad.
Configuración del dispositivo — Qué funciona y dónde
El modo de mismo idioma es independiente del dispositivo, pero ciertas configuraciones funcionan mejor que otras según el caso de uso:
- Teléfono en un soporte, cerca del televisor — la configuración de accesibilidad más económica. Un soporte de escritorio de $10 mantiene el teléfono en posición vertical junto al televisor para que ambas personas puedan ver los subtítulos sin sostener nada. Funciona con el micrófono del teléfono captando el audio del televisor; funciona mejor si conectas el teléfono al Bluetooth del televisor o usas un cable auxiliar.
- Tableta en un soporte, junto a un portátil — ideal para reuniones. Una tableta de 10 pulgadas ejecutando la marquesina ofrece texto de subtítulos legible sin consumir espacio en la pantalla del portátil. Usa el micrófono de la tableta o el del portátil; cualquiera funciona.
- Portátil apoyado, segundo monitor — bueno para oficinas en casa. Abre la URL de la marquesina independiente en un segundo monitor para que funcione de forma independiente de lo que estés haciendo en la pantalla principal.
- Smart TV mediante Chromecast o navegador integrado — ideal para eventos en vivo y lugares de culto. Transmite la URL de la marquesina independiente desde un teléfono mediante Chromecast, o ábrela directamente en el navegador del televisor si tiene uno. El diseño de panel único a pantalla completa está diseñado exactamente para esta configuración.
- Fuente de navegador en OBS — para streamers. Agrega la URL de la marquesina independiente como fuente de navegador y colócala como un tercio inferior o una cinta de ancho completo. El consumo de créditos es insignificante para la duración típica de una transmisión.
Limitaciones — Qué esperar
Vale la pena ser transparente sobre dónde falla la voz a texto en vivo, porque el modo de mismo idioma pone los subtítulos directamente frente a ti en lugar de ocultarlos en una capa de traducción.
- Los nombres propios, números y acrónimos son la clase de palabras más difícil. Nombres de calles, apellidos desconocidos, cadenas numéricas largas, términos médicos, SKU de productos — aquí es donde se concentran los errores. El habla común es muy precisa; el vocabulario especializado es irregular.
- Sin diarización de hablantes. La marquesina no distingue entre hablantes. Todo lo que dice cada persona fluye en un único flujo. Para escenarios de un solo hablante (una conferencia, un sermón, un programa de televisión con una voz dominante) esto está bien; para una mesa redonda con cinco personas hablando produce una transcripción legible pero sin atribución.
- La puntuación se infiere, no es perfecta. El motor de voz coloca puntos y comas basándose en pausas y prosodia. Las oraciones largas y fluidas a veces aparecen como una sola oración sin puntuación; las frases cortas y cortadas a veces aparecen como fragmentos. Es legible pero no está listo para publicación.
- La latencia es inferior a un segundo, pero no es cero. Espera que los subtítulos aparezcan aproximadamente medio segundo a un segundo después de la palabra hablada, con una resolución más rápida para frases cortas y claras y más lenta para las largas y divagantes. Esto es cierto para todos los sistemas de subtitulado en vivo — humanos o automáticos — y generalmente está bien para la comprensión.
- El ruido de fondo importa. Audio limpio en = subtítulos limpios. Un teléfono colocado al otro lado de la habitación frente a un televisor que murmura producirá peores subtítulos que un teléfono sostenido a quince centímetros de un altavoz claro. Si la precisión importa, acorta la distancia entre el micrófono y la fuente.
- Sin modo sin conexión. El motor de voz funciona en la nube, por lo que necesitas una conexión a internet. Esta es una limitación real para algunos casos de uso y vale la pena saberlo de antemano.
Cómo se compara con las aplicaciones de subtitulado dedicadas
El modo de mismo idioma no es la única opción de subtitulado en tiempo real. Una comparación justa:
- Subtítulos automáticos de YouTube — gratuitos, excelentes, pero solo funcionan para contenido ya en YouTube. No sirven para televisión en vivo, Zoom, conversaciones en persona ni nada que no sea un video de YouTube.
- Otter.ai — herramienta de transcripción diseñada específicamente con sólida diarización de hablantes y transcripciones con búsqueda. Mejor para notas de reuniones profesionales; más caro, basado en suscripción y menos adecuado para casos de uso ambientales de "poner subtítulos en una pantalla".
- Subtítulos de Google Meet / Zoom / Teams — gratuitos y buenos, pero bloqueados dentro de sus respectivas plataformas. No pueden subtitular un podcast que suena por los altavoces, un programa de televisión, una conversación en persona o una transmisión.
- Live Transcribe (Android) / Live Captions (iOS, macOS, Windows) — excelentes opciones en el dispositivo que no requieren internet. Mejores para casos de uso sensibles a la privacidad; sin modo de pantalla compartida ni flexibilidad multidispositivo.
El modo de mismo idioma en Live Translate Live es mejor cuando lo que necesitas es una cinta de subtítulos compartible y legible en una pantalla que cualquier persona en la sala pueda ver — no una capa de subtítulos privada en el dispositivo ni una función de reunión específica de una plataforma. Es deliberadamente un complemento de esas herramientas, no un reemplazo. Si ya tienes Live Captions funcionando bien en tu portátil para ti mismo, no necesitas esto. Si necesitas subtítulos en la pared para una sala llena de personas, esta es la forma más sencilla de obtenerlos.
Preguntas frecuentes
¿Puedo usarlo con varios hablantes?
Sí, pero con una advertencia. Varias personas pueden hablar al mismo micrófono y la marquesina transcribirá todo en un único flujo. No etiqueta quién dijo qué — no hay diarización de hablantes. Para un hablante dominante con interjecciones ocasionales (un sermón, el presidente de una reunión, un profesor) esto funciona bien. Para una conversación libre entre cuatro personas produce una transcripción legible que mezcla a todos sin atribución.
¿Funciona sin conexión?
No. El pipeline de reconocimiento de voz funciona en la nube, por lo que necesitas una conexión a internet. Si el subtitulado sin conexión es un requisito imprescindible, las herramientas de subtitulado integradas del sistema operativo (Live Captions en iOS / macOS / Windows, Live Transcribe en Android) funcionan en el dispositivo y son excelentes para uso personal.
¿Qué tan precisa es la transcripción?
Para audio claro de habla común, la precisión es alta — comparable a los subtítulos automáticos de YouTube y los subtítulos de Google Meet, que usan motores subyacentes similares. Los puntos débiles son los nombres propios, números, acrónimos y el habla con acento marcado o superpuesta. La precisión escala con la calidad del audio: un teléfono cerca del hablante subtitulará mejor que un teléfono al otro lado de la habitación.
¿Puedo guardar la transcripción?
Sí. Cada sesión se guarda en tu historial de conversaciones, que puedes revisar y exportar más tarde. Consulta la página de funciones para ver las opciones de exportación actuales. Para usuarios avanzados, el historial incluye marcas de tiempo, por lo que puedes usarlo tanto como herramienta de subtitulado en vivo como herramienta de transcripción posterior.
Pantalla de panel único a pantalla completa
En el modo de traducción, la marquesina se divide en dos filas: una para cada idioma. En el modo de mismo idioma, toda la pantalla se usa para una única fila de texto desplazable. Esto significa texto más grande y mejor legibilidad — especialmente útil cuando la pantalla está al otro lado de la habitación o proyectada en una pared.
Todas las funciones existentes de la marquesina siguen funcionando: velocidad de desplazamiento ajustable, escala de fuente, modo pulsar para hablar, URLs de marquesina independiente, compatibilidad con fuente de navegador en OBS, y el modo de pantalla invertida vis-à-vis si quieres subtítulos legibles desde ambos lados de una mesa. La única diferencia con el modo de traducción es el diseño — una fila en lugar de dos — y la tasa de créditos.
Funciona con todo lo que ya usas
El modo de mismo idioma no es una función separada — es la misma aplicación en una configuración diferente. Todo lo que tienes configurado sigue funcionando:
- Marquesina independiente — Abre la marquesina en una pestaña o ventana del navegador separada, o comparte la URL con un smart TV
- Fuente de navegador en OBS — Tu configuración existente de OBS funciona sin cambios; la marquesina cambia automáticamente al modo de panel único
- Pulsar para hablar — Mantén el botón para transcribir, suéltalo para detener
- Historial de conversaciones — Todas las transcripciones se guardan en tu historial para revisarlas más tarde
Vuelve al modo de traducción en cualquier momento seleccionando un idioma de destino diferente. La marquesina restaurará el diseño de dos filas y reanudará la traducción a la tarifa estándar.
Pruébalo ahora
Inicia sesión en Live Translate Live, configura ambos idiomas con el mismo valor y empieza a hablar. Verás una única marquesina a pantalla completa desplazando tus palabras en tiempo real — a una fracción del costo. Ya sea que necesites subtítulos en vivo para accesibilidad, una pantalla de presentación, una superposición de transmisión o simplemente una forma de ver tu propio discurso en pantalla, el modo de mismo idioma te tiene cubierto.
Prueba por $1 — sin suscripción. Los créditos no caducan, por lo que un paquete cubre meses de subtitulado ocasional. Para un recorrido completo de la configuración de transmisión, consulta la guía de marquesina en OBS y smart TV.
Prueba Live Translate Live
Empieza a traducir conversaciones bilingües en tiempo real hoy mismo.
Comenzar Gratis