Audio Mode — Beurtgebaseerde Vertaling met Spraakweergave
Maart 2026
Live Translate Live heeft twee manieren om een live gesprek te vertalen. De primaire modus is de scrollende marquee — continue spraakherkenning die vertaalde tekst over een gedeeld scherm streamt. De tweede modus is audio mode: beurtgebaseerd, push-to-talk, waarbij het vertaalde resultaat hardop wordt voorgelezen door een AI-stem. U spreekt, u bekijkt uw transcriptie, u corrigeert wat de herkenningstool verkeerd heeft verstaan, u tikt op Vertalen, en dan hoort de andere persoon de vertaling in hun taal. Vervolgens geeft u de telefoon door over de toonbank, over de tafel, of terug naar uzelf, en is het hun beurt.
De marquee is gebouwd voor gedeelde schermen. Audio mode is gebouwd voor de telefoon in uw hand.
Audio mode vs. marquee mode — wanneer kiest u welke
Beide modi zijn beschikbaar in elk abonnement en u kunt er midden in een gesprek tussen wisselen. Ze lossen verschillende problemen op. De marquee werkt het best wanneer twee mensen comfortabel tegelijk naar één scherm kunnen kijken en geen van beiden het apparaat hoeft vast te houden. Audio mode werkt het best wanneer er geen goed oppervlak is om een telefoon op te leggen, wanneer de omgeving te luid is om een scrollend scherm in één oogopslag te lezen, of wanneer een of beide sprekers de vertaling om welke reden dan ook niet kunnen lezen.
| Situatie | Marquee | Audio | Waarom |
|---|---|---|---|
| Restauranttafel met een gedeelde telefoon plat tussen u in | Ja | Gaat | Beide sprekers kunnen hun kant van het scherm lezen; een continue stroom voelt natuurlijk aan bij een maaltijd. |
| Drukke marktkraam, geen vlak oppervlak | Nee | Ja | U staat en houdt de telefoon vast. Audio mode laat u praten, tonen en doorgeven. |
| Livestream of uitzendoverlay | Ja | Nee | OBS legt de scrollende marquee vast als een venstersbron. Audio mode heeft geen scherm voor het publiek. |
| Slechthorende gebruiker aan één kant | Ja | Nee | Tekst op het scherm is het hele punt. Gesproken weergave helpt niet. |
| Blinde of slechtziende gebruiker aan één kant | Nee | Ja | Spraakweergave verwijdert de vereiste om een scrollend scherm te lezen. |
| Luidruchtige bouwplaats of fabriekshal | Gaat | Ja, met oordopjes | Audio mode gecombineerd met oordopjes levert de vertaling direct af; scherm lezen is moeilijk met een helm op. |
| Stille vergaderruimte of hotellobby | Ja | Gaat | Continue marquee blinkt uit wanneer niemand hoeft te onderbreken om een telefoon door te geven. |
| Rideshare of taxi | Nee | Ja | De chauffeur houdt zijn ogen op de weg. Spraakweergave via de telefoonluidspreker regelt het. |
Een goede vuistregel: als u de telefoon van nature heen en weer zou doorgeven, gebruik dan audio mode. Als u de telefoon van nature neer zou leggen, gebruik dan de marquee.
De beurtgebaseerde werkwijze, stap voor stap
Audio mode is bewust lineair. Elke beurt is één rondreis — u spreekt, u vertaalt, u geeft door. Dit is precies wat er bij elke beurt gebeurt:
- Tik op push-to-talk en spreek uw zin. Houd uw telefoon in een comfortabele spreekpositie. U kunt push-to-talk gebruiken (houd de knop ingedrukt, laat los als u klaar bent) of de altijd-luisterende schakelaar. Push-to-talk werkt beter op lawaaierige plekken omdat de microfoon alleen actief is terwijl u spreekt.
- Bekijk de live transcriptie die op het scherm verschijnt. Uw woorden worden in realtime getranscribeerd met dynamische lettergrootte zodat ze op het scherm passen. Transcriptie is gratis — er worden geen credits verbruikt bij deze stap, ongeacht hoe lang u spreekt of hoe vaak u opnieuw begint.
- Bekijk en bewerk de transcriptie indien nodig. Spraakherkenners maken fouten bij eigennamen, cijfers en ongebruikelijke technische termen. Tik op de transcriptie om een woord te corrigeren vóór het vertalen. Dit is de stap die de marquee u niet kan geven — die vertaalt onmiddellijk, zodat een verkeerd verstaan woord al aan de andere kant van het scherm staat. In audio mode is de vertaling gebaseerd op precies wat u bedoelde te zeggen.
- Tik op Vertalen. Dit is de enige stap die credits kost. U wordt gefactureerd per teken vertaalde tekst en per teken gesynthetiseerde spraak — niets voor de transcriptie die eraan voorafging.
- Hoor de AI-stem afspelen in de doeltaal. De vertaling wordt hardop uitgesproken via de telefoonluidspreker (of oordopjes, indien aangesloten). De vertaalde tekst verschijnt ook op het scherm als terugvaloptie voor iedereen die liever leest.
- Geef het apparaat door, of speel opnieuw af. Geef de telefoon aan de andere spreker voor hun beurt, of tik op opnieuw afspelen als ze de vertaling nog eens willen horen. Wis het scherm wanneer u klaar bent om de volgende uitwisseling te beginnen.
Creditefficiëntie — transcribeer vrij, vertaal selectief
Dit is het deel van audio mode dat mensen verrast. De marquee factureert continu, omdat hij continu luistert en continu vertaalt — dat is wat hem live laat aanvoelen. Audio mode doet dat niet. In audio mode:
- Spraakherkenning werkt alleen terwijl u actief de push-to-talk-knop ingedrukt houdt (of terwijl de altijd-luisterende microfoon aan is).
- Transcriptie is gratis. Praat, wis het scherm, begin opnieuw, praat weer — er worden geen credits verplaatst.
- Credits worden alleen verbruikt wanneer u op Vertalen tikt, en alleen voor die specifieke zin.
Een gesprek van tien uitwisselingen bij een marktkraam — "hoeveel kost dit", "heeft u het in blauw", "ik neem er twee" — is doorgaans minder dan duizend tekens vertaalde tekst en duizend tekens gesynthetiseerde spraak. Dat zijn centen. Dezelfde tien uitwisselingen in marquee mode zouden inhouden dat de herkenningstool continu actief blijft tussen zinnen (inclusief de ongemakkelijke pauzes, de verkoper die met een andere klant praat, het omgevingsgeluid), wat oploopt tegen het tijdgebaseerde tarief. Audio mode is dramatisch goedkoper voor korte, transactionele gesprekken — het soort gesprekken dat plaatsvindt wanneer u op uw benen staat en een telefoon rondgeeft.
De afweging is duidelijk en het is de moeite waard eerlijk te zijn: audio mode is niet continu. U kiest wanneer u vertaalt, en dat introduceert kleine pauzes tussen beurten. Voor een zit-diner of een vergadering waarbij u wilt dat de vertaling ononderbroken aanvoelt, is de marquee het juiste hulpmiddel. Voor al het andere — vooral de onderstaande scenario's — betaalt audio mode zichzelf terug.
Scenario's waarbij audio mode zijn waarde bewijst
Transacties bij straatverkopers
U bent op een nachtmarkt in Taipei of een souk in Marrakesh. U houdt de telefoon in één hand en een papieren zak in de andere. Er is geen tafel. De verkoper staat achter een toonbank, een meter verderop, met zijn eigen stroom klanten. U tikt op push-to-talk, stelt uw vraag, tikt op Vertalen, en de verkoper hoort het antwoord in zijn taal zonder over een scherm te hoeven leunen. Als ze willen antwoorden, geeft u de telefoon over de toonbank voor hun beurt. De hele uitwisseling duurt misschien vijftien seconden en kost een fractie van een credit.
Lawaaierige markten en toeristische gebieden
Audioweergave via oordopjes snijdt door omgevingsgeluid heen op een manier die scherm lezen niet doet. Als beide sprekers oordopjes hebben — of als u een paar deelt — speelt de vertaling direct in het oor, zelfs als de straat om u heen 85 dB is. Push-to-talk is hier de juiste invoerkeuze omdat het de microfoon sluit wanneer u niet actief spreekt, zodat de herkenningstool niet probeert de menigte te transcriberen.
Toegankelijkheid voor slechtziende gebruikers
De AI-spraakweergave is geen gemaksfunctie voor slechtziende gebruikers — het is de kernfunctie. U spreekt, de vertaling wordt uitgesproken in de doeltaal, en niemand hoeft ooit een scrollend scherm te lezen. Dit is een van de duidelijkste voordelen van audio mode ten opzichte van de marquee, en een reden waarom we beide modi in het product houden in plaats van een kant te kiezen.
Rideshare- en taxigesprekken
De chauffeur rijdt. Ze gaan niet naar uw scherm kijken, en u wilt dat ook niet. Audio mode via de telefoonluidspreker laat u een route opgeven, naar de weg vragen of een tarief afspreken zonder dat een van u de ogen van de weg haalt. Voor het antwoord van de chauffeur kunt u de telefoon aan een passagier voorin geven, of de altijd-luisterende modus gebruiken terwijl ze kort spreken.
Zorgintake en klinische vragen
Een verpleegkundige leest een vraag voor van een klembord. U antwoordt in uw eigen taal. U tikt op Vertalen, en de clinicus hoort het antwoord hoorbaar uitgesproken — handsfree — terwijl ze schrijven of typen in het intakeformulier. Omdat transcriptie gratis is, kunt u zo lang als nodig antwoorden, onderweg herformuleren, en pas credits besteden wanneer het antwoord definitief is. Voor medische eigennamen (geneesmiddelennamen, aandoeningen) is de stap voor beoordeling en bewerking bijzonder nuttig.
Hotelreceptie en serviceloketten
U houdt de telefoon aan uw kant van de toonbank, spreekt, en schuift hem dan over voor de medewerker om te antwoorden. Het geluid speelt hoorbaar genoeg voor u beiden, en de transcriptie op het scherm werkt als back-up wanneer de lobby echoërig is. Voor korte uitwisselingen — inchecken, uitchecken, "is er een apotheek in de buurt" — kost audio mode bijna niets en verwijdert het de ongemakkelijkheid van twee mensen die over één telefoon leunen.
Tips voor apparaatplaatsing en volume
Een paar dingen die audio mode beter laten werken in de echte wereld:
- Houd de telefoon dicht genoeg om helder geluid op te vangen, maar niet zo dicht dat de microfoon overbelast raakt. Vijftien tot dertig centimeter van uw mond is een goed bereik. Telefoons met meerdere microfoons gaan redelijk goed om met wind en achtergrondgeluid, maar kunnen geen geluid redden dat van de andere kant van een tafel is opgenomen.
- Gebruik push-to-talk wanneer het omgevingsgeluid luid is. Altijd-luisteren probeert alles te transcriberen wat het hoort, inclusief de persoon naast u. Push-to-talk sluit de microfoon tussen beurten.
- Zet het mediavolume omhoog vóór uw eerste vertaling. De AI-spraakweergave loopt via het mediakanaal van de telefoon, niet via de beltoon. Als uw mediavolume op nul staat, klinkt de eerste weergave stil en denkt u dat er iets kapot is.
- Oordopjes zijn beter dan een luidspreker op drukke plekken, zowel voor de helderheid van de weergave als voor de privacy. Als u een paar deelt, geef dan het vrije oordopje mee met de telefoon.
- Sluit aan op stroom bij lange uitwisselingen. Continu push-to-talk tijdens een lang gesprek tast de batterij merkbaar aan — minder dan de marquee, maar toch merkbaar.
Eerlijke beperkingen van AI-spraakweergave
De AI-stem is goed. Het is geen mens. Een paar dingen om te weten:
- Prosodie is beter in sommige talen dan andere. Engels, Spaans, Frans, Duits, Japans en Mandarijn klinken doorgaans het meest natuurlijk. Talen met een kleinere bevolking kunnen meer afgehakt of robotachtig klinken, vooral bij langere zinnen.
- Eigennamen zijn een bekende zwakte. Persoonsnamen, straatnamen, merknamen en technische termen worden soms uitgesproken alsof het gewone woorden zijn in de doeltaal. Het beoordelen en licht herschrijven van de transcriptie vóór het vertalen helpt — bijvoorbeeld "Saint-Laurent Boulevard" fonetisch uitschrijven.
- Korte pauzes tussen zinnen, geen natuurlijke stroom. Elke vertaling wordt gegenereerd als een volledige uiting. Twee opeenvolgende vertalingen klinken als twee afzonderlijke zinnen, niet als een continue spreker. Dit is doorgaans prima in een beurtgebaseerd gesprek en is het juiste gedrag gezien het feit dat u tussen elke beurt op Vertalen tikt.
- 32 talen ondersteunen spraakweergave. Talen buiten die set worden nog steeds correct vertaald in tekst — ze worden alleen niet hoorbaar afgespeeld. De marquee verwerkt die talen zonder deze beperking.
Veelgestelde vragen
Hoeveel credits kost een enkele vertaling in audio mode?
Het hangt af van de lengte van wat u vertaalt, maar korte conversationele zinnen (een vraag, een prijs, een eenregelig antwoord) kosten doorgaans een fractie van een credit elk — gefactureerd per teken vertaalde tekst en per teken gegenereerde spraak. Een marktgesprek van tien beurten komt meestal neer op centen. Zie de prijspagina voor exacte tarieven.
Kan ik audio mode gebruiken zonder internetverbinding?
Nee. Spraakherkenning, vertaling en spraaksynthese draaien allemaal in de cloud. Een stabiele verbinding is belangrijker dan een snelle — audio mode verstuurt korte geluidsfragmenten, geen continue stroom, dus het werkt goed op wankele mobiele data zolang er verbinding is.
Wat gebeurt er als ik me verspreek — kan ik opnieuw opnemen?
Ja, en dat zou u moeten doen. Transcriptie is gratis, dus er is geen straf voor opnieuw beginnen. Wis de transcriptie en druk opnieuw op push-to-talk, of blijf gewoon spreken — de transcriptie wordt live bijgewerkt. U verbindt zich pas aan een vertaling wanneer u op Vertalen tikt, en u kunt de transcriptietekst direct vóór dat moment bewerken.
Kan ik midden in een gesprek overschakelen naar marquee mode?
Ja. Modusselectie is een schakelaar, geen sessiegrens. Als het gesprek verschuift van een staande marktuitwisseling naar een zit-koffie, schakel dan over naar de marquee zonder uw taalpaar of uw geschiedenis te verliezen. Zie same-language transcription mode voor een derde verwante modus die overlapt met de gratis transcriptie van audio mode.
Probeer audio mode
Als u in de nabije toekomst een reizigersgesprек hebt — een markt, een taxi, een kliniek, een hotelreceptie — is audio mode de eerste om te proberen. Combineer het met de algemene gewoonten voor praten met iemand die uw taal niet spreekt (korte zinnen, één vraag tegelijk, eigennamen bevestigen) en het zal de meerderheid van echte uitwisselingen aan kunnen voor een prijs die u niet op uw rekening zult opmerken.
Probeer voor $1 — geen abonnement · Bekijk prijzen · Bekijk alle functies
Probeer Live Translate Live
Begin vandaag met het realtime vertalen van tweetalige gesprekken.
Gratis aan de slag