Modo de audio — Traducción por turnos con reproducción de voz

Marzo de 2026

Live Translate Live tiene dos formas de traducir una conversación en vivo. El modo principal es el marquee desplazable — reconocimiento de voz continuo que transmite texto traducido a través de una pantalla compartida. El segundo modo es el modo de audio: por turnos, con pulsar para hablar, y el resultado traducido se reproduce en voz alta mediante una voz de IA. Hablas, revisas tu transcripción, corriges lo que el reconocedor haya escuchado mal, pulsas Traducir, y la otra persona escucha la traducción en su idioma. Luego pasas el teléfono al otro lado del mostrador, de la mesa, o de vuelta a ti mismo, y es su turno.

El marquee está diseñado para pantallas compartidas. El modo de audio está diseñado para el teléfono en tu mano.

Modo de audio vs. modo marquee — cuándo elegir cada uno

Ambos modos están disponibles en todos los planes y puedes cambiar entre ellos a mitad de una conversación. Resuelven problemas distintos. El marquee funciona mejor cuando dos personas pueden ver cómodamente una pantalla al mismo tiempo y ninguna necesita sostener el dispositivo. El modo de audio funciona mejor cuando no hay una superficie adecuada donde apoyar el teléfono, cuando el entorno es demasiado ruidoso para leer una pantalla desplazable de un vistazo, o cuando uno o ambos interlocutores no pueden leer la traducción por cualquier motivo.

SituaciónMarqueeAudioPor qué
Mesa de restaurante con el teléfono compartido y plano entre vosotros Aceptable Ambos interlocutores pueden leer su parte de la pantalla; el flujo continuo resulta natural durante una comida.
Mercado concurrido, sin superficie plana No Estás de pie sosteniendo el teléfono. El modo de audio te permite hablar, mostrar y pasar el teléfono.
Superposición en transmisión en vivo o emisión No OBS captura el marquee desplazable como fuente de ventana. El modo de audio no tiene pantalla para la audiencia.
Usuario con discapacidad auditiva en un lado No El texto en pantalla es el punto central. La reproducción hablada no ayuda.
Usuario ciego o con baja visión en un lado No La reproducción de voz elimina la necesidad de leer una pantalla desplazable.
Obra de construcción ruidosa o planta de fábrica Aceptable Sí, con auriculares El modo de audio combinado con auriculares entrega la traducción directamente; leer la pantalla es difícil con un casco puesto.
Sala de conferencias tranquila o vestíbulo de hotel Aceptable El marquee continuo brilla cuando nadie tiene que interrumpir para pasar el teléfono.
Servicio de transporte compartido o taxi No El conductor mantiene los ojos en la carretera. La reproducción de voz por el altavoz del teléfono lo gestiona.

Una buena regla general: si naturalmente pasarías el teléfono de un lado a otro, usa el modo de audio. Si naturalmente dejarías el teléfono sobre una superficie, usa el marquee.

El flujo de trabajo por turnos, paso a paso

El modo de audio es deliberadamente lineal. Cada turno es un viaje de ida y vuelta — hablas, traduces, pasas el teléfono. Esto es exactamente lo que ocurre en cada turno:

  1. Pulsa para hablar y di tu frase. Sostén el teléfono en una posición cómoda para hablar. Puedes usar pulsar para hablar (mantén el botón pulsado, suéltalo cuando termines) o el modo de escucha continua. Pulsar para hablar es mejor en lugares ruidosos porque el micrófono solo está activo mientras hablas.
  2. Observa cómo aparece la transcripción en vivo en pantalla. Tus palabras se transcriben en tiempo real con un tamaño de fuente dinámico para que encajen en la pantalla. La transcripción es gratuita — no se gastan créditos en este paso, sin importar cuánto tiempo hables ni cuántas veces reinicies.
  3. Revisa y edita la transcripción si es necesario. Los reconocedores de voz cometen errores con nombres propios, números y términos técnicos poco comunes. Pulsa la transcripción para corregir una palabra antes de traducir. Este es el paso que el marquee no puede ofrecerte — traduce de inmediato, por lo que una palabra mal escuchada ya aparece al otro lado de la pantalla. En el modo de audio, la traducción se basa exactamente en lo que querías decir.
  4. Pulsa Traducir. Este es el único paso que consume créditos. Se te cobra por carácter de texto traducido y por carácter de voz sintetizada — nada por la transcripción anterior.
  5. Escucha la voz de IA reproducirse en el idioma de destino. La traducción se reproduce en voz alta por el altavoz del teléfono (o por los auriculares, si están conectados). El texto traducido también aparece en pantalla como alternativa para quienes prefieren leer.
  6. Pasa el dispositivo o reprodúcelo de nuevo. Pasa el teléfono al otro interlocutor para su turno, o pulsa reproducir si quiere escuchar la traducción otra vez. Limpia la pantalla cuando estés listo para comenzar el siguiente intercambio.

Eficiencia de créditos — transcribe libremente, traduce selectivamente

Esta es la parte del modo de audio que sorprende a la gente. El marquee factura de forma continua, porque escucha y traduce de forma continua — eso es lo que lo hace sentir en vivo. El modo de audio no. En el modo de audio:

Una conversación de diez intercambios en un puesto de mercado — "cuánto cuesta esto", "¿lo tienes en azul?", "me llevo dos" — suele ser de menos de mil caracteres de texto traducido y mil caracteres de voz sintetizada. Eso son céntimos. Los mismos diez intercambios en modo marquee implicarían mantener el reconocedor funcionando continuamente entre frases (incluidas las pausas incómodas, el vendedor hablando con otro cliente, el ruido ambiental), lo que se acumula a la tarifa basada en tiempo. El modo de audio es considerablemente más económico para conversaciones cortas y transaccionales — el tipo de conversaciones que ocurren cuando estás de pie pasando el teléfono de mano en mano.

La contrapartida es obvia y vale la pena ser honesto al respecto: el modo de audio no es continuo. Tú decides cuándo traducir, y eso introduce pequeñas pausas entre turnos. Para una cena sentados o una reunión donde quieres que la traducción parezca ininterrumpida, el marquee es la herramienta adecuada. Para todo lo demás — especialmente los escenarios a continuación — el modo de audio se paga solo.

Escenarios donde el modo de audio demuestra su valor

Transacciones con vendedores callejeros

Estás en un mercado nocturno en Taipéi o en un zoco en Marrakech. Sostienes el teléfono en una mano y una bolsa de papel en la otra. No hay mesa. El vendedor está detrás de un mostrador, a un metro de distancia, con su propio flujo de clientes. Pulsas para hablar, haces tu pregunta, pulsas Traducir, y el vendedor escucha la respuesta en su idioma sin necesidad de inclinarse sobre una pantalla. Si quiere responder, le pasas el teléfono al otro lado del mostrador para su turno. Todo el intercambio dura unos quince segundos y cuesta una fracción de un crédito.

Mercados ruidosos y zonas turísticas

La reproducción de audio por auriculares atraviesa el ruido ambiental de una manera que la lectura en pantalla no puede. Si ambos interlocutores tienen auriculares — o si comparten un par — la traducción suena directamente en el oído, incluso si la calle a tu alrededor está a 85 dB. Pulsar para hablar es la opción de entrada correcta aquí porque mantiene el micrófono cerrado cuando no estás hablando activamente, de modo que el reconocedor no intenta transcribir a la multitud.

Accesibilidad para usuarios con baja visión

La reproducción de voz de IA no es una función de conveniencia para usuarios con baja visión — es la función principal. Hablas, la traducción se reproduce en el idioma de destino, y nadie tiene que leer una pantalla desplazable. Esta es una de las ventajas más claras que el modo de audio tiene sobre el marquee, y una razón por la que mantenemos ambos modos en el producto en lugar de decantarnos por uno.

Conversaciones en servicios de transporte compartido y taxis

El conductor está conduciendo. No va a mirar tu pantalla, y no quieres que lo haga. El modo de audio por el altavoz del teléfono te permite dar indicaciones, preguntar sobre la ruta o acordar una tarifa sin que ninguno de los dos aparte los ojos de la carretera. Para la respuesta del conductor, puedes pasar el teléfono a un pasajero del asiento delantero, o usar el modo de escucha continua mientras habla brevemente.

Registro sanitario y preguntas clínicas

Una enfermera lee una pregunta de un portapapeles. Respondes en tu propio idioma. Pulsas Traducir, y el profesional sanitario escucha la respuesta en voz alta — con las manos libres — mientras escribe o teclea en el formulario de registro. Como la transcripción es gratuita, puedes tomarte todo el tiempo que necesites para responder, reformular sobre la marcha, y solo gastar créditos cuando la respuesta es definitiva. Para nombres propios médicos (nombres de medicamentos, afecciones), el paso de revisión y edición es especialmente útil.

Recepción de hotel y mostradores de atención

Sostienes el teléfono en tu lado del mostrador, hablas y luego lo deslizas al otro lado para que el empleado responda. El audio se reproduce con suficiente volumen para que ambos lo escuchen, y la transcripción en pantalla funciona como respaldo cuando el vestíbulo tiene eco. Para intercambios cortos — entrada, salida, "¿hay una farmacia cerca?" — el modo de audio casi no cuesta nada y elimina la incomodidad de dos personas inclinadas sobre un mismo teléfono.

Consejos sobre la colocación del dispositivo y el volumen

Algunas cosas que hacen que el modo de audio funcione mejor en el mundo real:

Limitaciones honestas de la reproducción de voz de IA

La voz de IA es buena. No es humana. Algunas cosas que conviene saber:

Preguntas frecuentes

¿Cuántos créditos cuesta una sola traducción en modo de audio?

Depende de la longitud de lo que traduzcas, pero las frases conversacionales cortas (una pregunta, un precio, una respuesta de una línea) suelen costar una fracción de un crédito cada una — facturadas por carácter de texto traducido y por carácter de voz generada. Una conversación de diez turnos en un mercado suele salir por céntimos. Consulta la página de precios para conocer las tarifas exactas.

¿Puedo usar el modo de audio sin conexión a internet?

No. El reconocimiento de voz, la traducción y la síntesis de voz funcionan todos en la nube. Una conexión estable importa más que una rápida — el modo de audio envía ráfagas cortas de audio, no una transmisión continua, por lo que funciona bien con datos móviles inestables siempre que haya conexión.

¿Qué pasa si me equivoco al hablar — puedo volver a grabar?

Sí, y deberías hacerlo. La transcripción es gratuita, así que no hay penalización por reiniciar. Limpia la transcripción y vuelve a pulsar para hablar, o simplemente sigue hablando — la transcripción se actualiza en vivo. Solo confirmas una traducción cuando pulsas Traducir, y puedes editar el texto de la transcripción directamente antes de ese momento.

¿Puedo cambiar al modo marquee a mitad de una conversación?

Sí. La selección de modo es un interruptor, no un límite de sesión. Si la conversación pasa de un intercambio de pie en el mercado a un café sentados, cambia al marquee sin perder tu par de idiomas ni tu historial. Consulta el modo de transcripción en el mismo idioma para conocer un tercer modo relacionado que se superpone con la transcripción gratuita del modo de audio.

Prueba el modo de audio

Si tienes una conversación de viajero en tu futuro próximo — un mercado, un taxi, una clínica, la recepción de un hotel — el modo de audio es el que debes probar primero. Combínalo con los hábitos de hablar con alguien que no comparte tu idioma (frases cortas, una pregunta a la vez, confirmar los nombres propios) y gestionará la mayoría de los intercambios del mundo real a un coste que no notarás en tu factura.

Prueba por $1 — sin suscripción · Ver precios · Ver todas las funciones


Prueba Live Translate Live

Empieza a traducir conversaciones bilingües en tiempo real hoy mismo.

Comenzar Gratis