Audio Mode — Traduction en Tour par Tour avec Lecture Vocale
Mars 2026
Live Translate Live propose deux façons de traduire une conversation en direct. Le mode principal est le défilement en marquee — reconnaissance vocale continue diffusant le texte traduit sur un écran partagé. Le second mode est l'audio mode : en tour par tour, avec appui pour parler, et le résultat traduit est énoncé à voix haute par une voix IA. Vous parlez, vous relisez votre transcription, vous corrigez ce que le système a mal compris, vous appuyez sur Traduire, puis l'autre personne entend la traduction dans sa langue. Ensuite, vous passez le téléphone par-dessus le comptoir, par-dessus la table, ou vous le reprenez, et c'est son tour.
Le marquee est conçu pour les écrans partagés. L'audio mode est conçu pour le téléphone dans votre main.
Audio mode vs. marquee mode — quand choisir lequel
Les deux modes sont inclus dans chaque formule et vous pouvez basculer de l'un à l'autre en cours de conversation. Ils résolvent des problèmes différents. Le marquee fonctionne mieux quand deux personnes peuvent confortablement voir un même écran en même temps, et qu'aucune d'elles n'a besoin de tenir l'appareil. L'audio mode fonctionne mieux quand il n'y a pas de surface adéquate pour poser un téléphone, quand l'environnement est trop bruyant pour lire un affichage défilant d'un coup d'œil, ou quand l'un ou les deux interlocuteurs ne peuvent pas lire la traduction pour quelque raison que ce soit.
| Situation | Marquee | Audio | Pourquoi |
|---|---|---|---|
| Table de restaurant avec un téléphone partagé à plat entre vous | Oui | Possible | Les deux interlocuteurs peuvent lire leur côté de l'écran ; le flux continu semble naturel pendant un repas. |
| Marché animé, pas de surface plane | Non | Oui | Vous êtes debout et tenez le téléphone. L'audio mode vous permet de parler, de montrer et de passer l'appareil. |
| Incrustation pour live stream ou diffusion | Oui | Non | OBS capture le marquee défilant comme source de fenêtre. L'audio mode n'a pas d'écran pour le public. |
| Utilisateur malentendant d'un côté | Oui | Non | Le texte à l'écran est l'essentiel. La lecture vocale n'est d'aucune aide. |
| Utilisateur aveugle ou malvoyant d'un côté | Non | Oui | La lecture vocale supprime l'obligation de lire un affichage défilant. |
| Chantier bruyant ou atelier industriel | Possible | Oui, avec des écouteurs | L'audio mode associé à des écouteurs délivre la traduction directement ; lire un écran est difficile avec un casque de chantier. |
| Salle de conférence calme ou hall d'hôtel | Oui | Possible | Le marquee continu est idéal quand personne n'a besoin d'interrompre la conversation pour passer un téléphone. |
| Covoiturage ou taxi | Non | Oui | Le conducteur garde les yeux sur la route. La lecture vocale via le haut-parleur du téléphone s'en charge. |
Une bonne règle empirique : si vous passeriez naturellement le téléphone d'une main à l'autre, utilisez l'audio mode. Si vous poseriez naturellement le téléphone, utilisez le marquee.
Le déroulement en tour par tour, étape par étape
L'audio mode est délibérément linéaire. Chaque tour est un aller-retour — vous parlez, vous traduisez, vous passez l'appareil. Voici exactement ce qui se passe à chaque tour :
- Appuyez sur appui pour parler et énoncez votre phrase. Tenez votre téléphone dans une position confortable pour parler. Vous pouvez utiliser l'appui pour parler (maintenez le bouton enfoncé, relâchez quand vous avez terminé) ou le mode d'écoute permanente. L'appui pour parler est préférable dans les endroits bruyants car le micro n'est actif que lorsque vous parlez.
- Regardez la transcription en direct apparaître à l'écran. Vos mots sont transcrits en temps réel avec une taille de police dynamique pour s'adapter à l'affichage. La transcription est gratuite — aucun crédit n'est dépensé à cette étape, quelle que soit la durée de votre prise de parole ou le nombre de fois où vous recommencez.
- Relisez et modifiez la transcription si nécessaire. Les systèmes de reconnaissance vocale font des erreurs sur les noms propres, les chiffres et les termes techniques inhabituels. Appuyez sur la transcription pour corriger un mot avant de traduire. C'est l'étape que le marquee ne peut pas vous offrir — il traduit immédiatement, donc un mot mal compris est déjà affiché de l'autre côté de l'écran. En audio mode, la traduction est basée sur exactement ce que vous vouliez dire.
- Appuyez sur Traduire. C'est la seule étape qui consomme des crédits. Vous êtes facturé par caractère de texte traduit et par caractère de synthèse vocale — rien pour la transcription qui précède.
- Écoutez la voix IA lire la traduction dans la langue cible. La traduction est énoncée à voix haute via le haut-parleur du téléphone (ou les écouteurs, s'ils sont connectés). Le texte traduit apparaît également à l'écran en solution de repli pour ceux qui préfèrent lire.
- Passez l'appareil, ou relancez la lecture. Donnez le téléphone à l'autre interlocuteur pour son tour, ou appuyez sur relire s'il souhaite entendre la traduction à nouveau. Effacez l'écran quand vous êtes prêt à commencer l'échange suivant.
Efficacité des crédits — transcrivez librement, traduisez de façon sélective
C'est la partie de l'audio mode qui surprend les gens. Le marquee facture en continu, car il écoute en continu et traduit en continu — c'est ce qui lui donne un caractère live. L'audio mode, non. En audio mode :
- La reconnaissance vocale ne fonctionne que lorsque vous maintenez activement le bouton d'appui pour parler (ou lorsque le micro en écoute permanente est activé).
- La transcription est gratuite. Parlez, effacez l'écran, recommencez, reparlez — aucun crédit ne bouge.
- Les crédits ne sont consommés que lorsque vous appuyez sur Traduire, et uniquement pour cette phrase spécifique.
Une conversation de dix échanges dans un marché — « combien ça coûte », « vous l'avez en bleu », « j'en prends deux » — représente généralement moins d'un millier de caractères de texte traduit et d'un millier de caractères de synthèse vocale. C'est une somme dérisoire. Les mêmes dix échanges en mode marquee impliqueraient de maintenir le système de reconnaissance actif en continu entre les phrases (y compris les pauses gênantes, le vendeur qui parle à un autre client, le bruit ambiant), ce qui s'accumule au tarif basé sur le temps. L'audio mode est nettement moins cher pour les conversations courtes et transactionnelles — le type de conversations qui se produisent quand vous êtes debout et que vous passez un téléphone de main en main.
Le compromis est évident et mérite d'être honnête : l'audio mode n'est pas continu. Vous choisissez quand traduire, ce qui introduit de courtes pauses entre les tours. Pour un dîner assis ou une réunion où vous souhaitez que la traduction semble ininterrompue, le marquee est le bon outil. Pour tout le reste — en particulier les scénarios ci-dessous — l'audio mode s'autofinance.
Scénarios où l'audio mode fait ses preuves
Transactions avec des vendeurs de rue
Vous êtes dans un marché nocturne à Taipei ou dans un souk à Marrakech. Vous tenez le téléphone d'une main et un sac en papier de l'autre. Il n'y a pas de table. Le vendeur est derrière un comptoir, à un mètre de vous, avec son propre flux de clients. Vous appuyez sur appui pour parler, posez votre question, appuyez sur Traduire, et le vendeur entend la réponse dans sa langue sans avoir besoin de se pencher sur un écran. S'il veut répondre, vous lui passez le téléphone par-dessus le comptoir pour son tour. L'échange entier prend peut-être quinze secondes et coûte une fraction de crédit.
Marchés bruyants et zones touristiques
La lecture audio via des écouteurs perce le bruit ambiant d'une façon que la lecture d'un écran ne permet pas. Si les deux interlocuteurs ont des écouteurs — ou si vous en partagez une paire — la traduction est diffusée directement dans l'oreille, même si la rue autour de vous est à 85 dB. L'appui pour parler est le bon choix de saisie ici car il ferme le micro entre les tours, de sorte que le système de reconnaissance n'essaie pas de transcrire la foule.
Accessibilité pour les utilisateurs malvoyants
La lecture vocale IA n'est pas une fonctionnalité de confort pour les utilisateurs malvoyants — c'est la fonctionnalité principale. Vous parlez, la traduction est énoncée dans la langue cible, et personne n'a jamais besoin de lire un affichage défilant. C'est l'un des avantages les plus clairs de l'audio mode sur le marquee, et l'une des raisons pour lesquelles nous conservons les deux modes dans le produit au lieu d'en choisir un seul.
Conversations en covoiturage et en taxi
Le conducteur conduit. Il ne va pas regarder votre écran, et vous ne le souhaitez pas non plus. L'audio mode via le haut-parleur du téléphone vous permet de donner des indications, de vous renseigner sur l'itinéraire ou de convenir d'un tarif sans qu'aucun de vous deux ne détourne les yeux de la route. Pour la réponse du conducteur, vous pouvez passer le téléphone à un passager à l'avant, ou utiliser le mode d'écoute permanente pendant qu'il parle brièvement.
Accueil médical et questions cliniques
Une infirmière lit une question depuis un formulaire. Vous répondez dans votre propre langue. Vous appuyez sur Traduire, et le clinicien entend la réponse énoncée à voix haute — en mode mains libres — pendant qu'il écrit ou saisit dans le formulaire d'accueil. Comme la transcription est gratuite, vous pouvez prendre tout le temps nécessaire pour répondre, reformuler au fur et à mesure, et ne dépenser des crédits que lorsque la réponse est définitive. Pour les noms propres médicaux (noms de médicaments, pathologies), l'étape de relecture et de modification est particulièrement utile.
Réception d'hôtel et comptoirs de service
Vous tenez le téléphone de votre côté du comptoir, parlez, puis le faites glisser vers le réceptionniste pour qu'il réponde. L'audio est suffisamment audible pour vous deux, et la transcription à l'écran sert de solution de repli quand le hall est réverbérant. Pour les échanges courts — enregistrement, départ, « y a-t-il une pharmacie à proximité » — l'audio mode ne coûte presque rien et supprime la gêne de deux personnes penchées sur un seul téléphone.
Conseils de placement de l'appareil et de volume
Quelques éléments qui permettent à l'audio mode de mieux fonctionner dans le monde réel :
- Tenez le téléphone suffisamment près pour capter un audio clair, mais pas au point que le micro sature. De quinze à trente centimètres de votre bouche est une bonne plage. Les téléphones équipés de plusieurs micros gèrent raisonnablement bien le vent et le bruit de fond, mais ils ne peuvent pas rattraper un audio enregistré depuis l'autre bout d'une table.
- Utilisez l'appui pour parler quand le bruit ambiant est fort. L'écoute permanente tentera de transcrire tout ce qu'elle entend, y compris la personne à côté de vous. L'appui pour parler ferme le micro entre les tours.
- Montez le volume multimédia avant votre première traduction. La lecture vocale IA passe par le canal multimédia du téléphone, pas par la sonnerie. Si votre volume multimédia est à zéro, la première lecture sera silencieuse et vous penserez que quelque chose ne fonctionne pas.
- Les écouteurs sont préférables au haut-parleur dans les endroits bondés, tant pour la clarté de la lecture que pour la confidentialité. Si vous partagez une paire, passez l'écouteur libre avec le téléphone.
- Pour les échanges longs, branchez le chargeur. L'appui pour parler en continu lors d'une longue conversation décharge la batterie de façon notable — moins que le marquee, mais tout de même perceptible.
Limites honnêtes de la lecture vocale IA
La voix IA est bonne. Elle n'est pas humaine. Quelques points à savoir :
- La prosodie est meilleure dans certaines langues que dans d'autres. L'anglais, l'espagnol, le français, l'allemand, le japonais et le mandarin ont tendance à sonner le plus naturellement. Les langues à faible population de locuteurs peuvent sonner plus saccadées ou robotiques, surtout sur les phrases longues.
- Les noms propres sont une faiblesse connue. Les prénoms, les noms de rues, les noms de marques et les termes techniques sont parfois prononcés comme s'ils étaient des mots courants dans la langue cible. Relire et reformuler légèrement la transcription avant la traduction aide — par exemple, épeler phonétiquement « Boulevard Saint-Laurent ».
- De courtes pauses entre les phrases, pas un flux naturel. Chaque traduction est générée comme un énoncé complet. Deux traductions consécutives sonnent comme deux phrases distinctes, pas comme un locuteur continu. C'est généralement acceptable dans une conversation en tour par tour et correspond au comportement attendu puisque vous appuyez sur Traduire entre chacune.
- 32 langues prennent en charge la lecture vocale. Les langues en dehors de cet ensemble se traduisent correctement en texte — elles ne sont simplement pas lues à voix haute. Le marquee gère ces langues sans cette contrainte.
FAQ
Combien de crédits coûte une seule traduction en audio mode ?
Cela dépend de la longueur de ce que vous traduisez, mais les phrases conversationnelles courtes (une question, un prix, une réponse en une ligne) coûtent généralement une fraction de crédit chacune — facturées par caractère de texte traduit et par caractère de synthèse vocale générée. Une conversation de dix tours dans un marché revient généralement à quelques centimes. Consultez la page de tarification pour les tarifs exacts.
Puis-je utiliser l'audio mode sans connexion internet ?
Non. La reconnaissance vocale, la traduction et la synthèse vocale fonctionnent toutes dans le cloud. Une connexion stable importe plus qu'une connexion rapide — l'audio mode envoie de courtes rafales audio, pas un flux continu, donc il fonctionne bien sur une connexion cellulaire instable tant qu'elle est connectée.
Que se passe-t-il si je me trompe en parlant — puis-je réenregistrer ?
Oui, et vous devriez. La transcription est gratuite, donc il n'y a aucune pénalité à recommencer. Effacez la transcription et appuyez à nouveau sur appui pour parler, ou continuez simplement à parler — la transcription se met à jour en direct. Vous ne vous engagez dans une traduction que lorsque vous appuyez sur Traduire, et vous pouvez modifier le texte de la transcription directement avant ce moment.
Puis-je passer en mode marquee en cours de conversation ?
Oui. La sélection du mode est une bascule, pas une limite de session. Si la conversation passe d'un échange debout dans un marché à un café assis, passez au marquee sans perdre votre paire de langues ni votre historique. Consultez le mode de transcription dans la même langue pour un troisième mode connexe qui recoupe la transcription gratuite de l'audio mode.
Essayez l'audio mode
Si vous avez une conversation de voyageur dans un avenir proche — un marché, un taxi, une clinique, une réception d'hôtel — l'audio mode est celui à essayer en premier. Associez-le aux habitudes générales pour parler à quelqu'un qui ne partage pas votre langue (phrases courtes, une question à la fois, confirmer les noms propres) et il gérera la majorité des échanges du monde réel à un coût que vous ne remarquerez pas sur votre facture.
Essayer pour 1 $ — sans abonnement · Voir les tarifs · Voir toutes les fonctionnalités
Essayez Live Translate Live
Commencez à traduire des conversations bilingues en temps réel dès aujourd'hui.
Commencer gratuitement