Nu vertalen in 103 talen — Met AI-stem in 74

Mei 2026

Live Translate Live heeft zojuist een grote engine-vernieuwing gekregen. We hebben onze spraakherkenningsstack vervangen van Deepgram door ElevenLabs Scribe v2 Realtime, onze vertaallaag van Google Cloud Translation door Google Gemini 2.5, en live AI-stemweergave toegevoegd in Audio mode, aangedreven door ElevenLabs v3. Het belangrijkste getal: we zijn live in 103 talen voor realtime spraak, met AI-stem in 74 daarvan, en vertaling in elke richting tussen welke twee dan ook.

Als je het oude bericht over ondersteunde talen hebt gelezen toen we lanceerden met 47, is het aantal ruwweg verdubbeld. Dat bericht is nu bijgewerkt om de nieuwe situatie te weerspiegelen; dit bericht is de aankondiging van wat er is veranderd en waarom dat belangrijk is wanneer je de telefoon oppakt voor een echt gesprek.

Wat je nu kunt doen wat je eerder niet kon

De meest zichtbare verandering voor gebruikers is in de taalkiezer. Scroll naar beneden en je ziet twee keer zoveel opties. De talen die zijn toegevoegd zijn niet obscuur — het zijn talen waar velen van jullie om hebben gevraagd: Perzisch, Bengaals, Tamil, Telugu, Marathi, Hindi van hogere kwaliteit, Kantonees als aparte optie naast Mandarijn, Birmees, Khmer, Laotiaans, Mongools, Hausa, Swahili, Yoruba, Zoeloe, Welsh, Iers, Hebreeuws, en nog veel meer.

De tweede verandering is moeilijker te zien, maar je zult het voelen in een gesprek: de vertaalkwaliteit is merkbaar beter, vooral bij langere of meer genuanceerde beurten. Gemini 2.5 draagt gesprekscontext mee over beurten in plaats van elke zin afzonderlijk te vertalen. Voornaamwoorden krijgen het juiste antecedent. Geslachtsovereenkomst blijft behouden over een reeks zinnen. Idiomen worden omgezet naar het dichtstbijzijnde equivalent in de doeltaal in plaats van woord voor woord vertaald. De marquee voelt meer als een tolk en minder als een woordenboek.

De derde verandering is gloednieuw: Audio mode speelt de vertaling nu hardop af in een natuurlijke AI-stem. Je spreekt, je tikt op Vertalen, je telefoon spreekt de vertaalde zin uit in de taal van de luisteraar. Dit is de modus voor taxi's, marktkramen, wachtkamers in ziekenhuizen — plaatsen waar het lezen van een scrollend scherm onpraktisch is en je de telefoon van nature heen en weer zou geven.

Hoe nauwkeurig is de spraakherkenning?

ElevenLabs publiceert een vierniveaus nauwkeurigheidsraster voor Scribe v2 op basis van woordfoutpercentage (WER) benchmarks. We tonen deze niveaus als gekleurde stippen naast elke taal in de in-app taalkiezer, en we hebben de groepering hier weergegeven zodat je jouw taal in één oogopslag kunt vinden. Een lager WER betekent dat meer woorden correct worden herkend.

Niveau WER Talen
Uitstekend ≤ 5% Belarussisch, Bosnisch, Bulgaars, Catalaans, Kroatisch, Tsjechisch, Deens, Nederlands, Engels, Ests, Fins, Frans, Galicisch, Duits, Grieks, Hongaars, IJslands, Indonesisch, Italiaans, Japans, Kannada, Lets, Macedonisch, Maleis, Malayalam, Noors, Pools, Portugees, Roemeens, Russisch, Slowaaks, Spaans, Zweeds, Turks, Oekraïens, Vietnamees (36)
Hoog 5–10% Armeens, Azerbeidzjaans, Bengaals, Kantonees, Filipijns, Georgisch, Gujarati, Hindi, Kazachs, Litouws, Maltees, Mandarijn Chinees, Marathi, Nepalees, Odia, Perzisch, Servisch, Sloveens, Swahili, Tamil, Telugu (21)
Goed 10–15% Afrikaans, Arabisch, Assamees, Asturisch, Birmees, Hausa, Hebreeuws, Javaans, Koreaans, Kirgizisch, Luxemburgs, Māori, Occitaans, Punjabi, Tadzjieks, Thais, Oezbeeks, Welsh (18)
In ontwikkeling 15%+ Amhaars, Ganda, Igbo, Iers, Khmer, Koerdisch, Laotiaans, Mongools, Noord-Sotho, Pasjtoe, Shona, Sindhi, Somalisch, Urdu, Wolof, Xhosa, Yoruba, Zoeloe (18)

WER-bereiken zijn afkomstig van ElevenLabs’ gepubliceerde Scribe v2-benchmarks. In de praktijk zijn microfoonpositie en omgevingsgeluid belangrijker dan het verschil tussen de twee hoogste niveaus; in een stille ruimte met een goede microfoon zijn een “Uitstekende” en een “Hoge” taal in een gesprek nauwelijks van elkaar te onderscheiden.

Een handige manier om de tabel te lezen: als jouw taalpaar in de twee hoogste niveaus valt, verdwijnt de herkenningslaag effectief — de woorden die je zegt verschijnen op het scherm terwijl je ze uitspreekt. Als één kant van het paar in het niveau Goed valt, zie je af en toe vervangingen bij ongewone woorden, vooral eigennamen. Als een kant in het niveau In ontwikkeling valt, werkt de taal maar zijn transcripties ruwer; in die gevallen kan Audio mode vriendelijker zijn omdat je de transcriptie kunt bekijken voordat je op Vertalen tikt.

Live AI-stemweergave in 74 talen

Audio mode is de grotere productverandering. De marquee was altijd het juiste hulpmiddel voor twee mensen die één scherm delen aan een tafel. Audio mode is voor de rest van de tijd — één telefoon, één hand, twee mensen die elkaar moeten horen in plaats van lezen.

Wanneer je op Nu vertalen tikt, genereert ElevenLabs v3 (of zijn snellere variant Flash v2.5, afhankelijk van de taal) de gesproken vertaling en speelt de telefoon deze af. Het klinkt als een persoon, niet als een robot. Je kunt op Opnieuw afspelen tikken zo vaak als je wilt zonder extra credits te verbruiken. Als je luisteraar het niet heeft gehoord, tik dan gewoon op Opnieuw afspelen.

Van de 103 talen die we herkennen, hebben 74 vandaag AI-stemdekking. Talen buiten die set werken nog steeds in Audio mode — je ziet de vertaalde tekst op het scherm — alleen zonder de gesproken weergave. De stemmenlijst groeit naarmate ElevenLabs dekkingsupdates uitbrengt; de app controleert dit bij het opstarten en pikt nieuwe talen automatisch op.

Als je Audio mode nog niet hebt geprobeerd, vind je de uitgebreide uitleg in ons Audio mode-bericht en de canonieke referentie staat op /languages.

Vertaling dekt alle 103 in elke richting

Gemini 2.5 verwerkt de vertaallaag, en het is van alles naar alles. Je kunt Japans spreken en het direct in Portugees laten landen, zonder Engels als tussenstap. Hindi naar Arabisch. Koreaans naar Swahili. Vietnamees naar Pools. Met 103 talen zijn dat 10.506 unieke paren, elk tegelijkertijd ondersteund in de tweewegsgespreksmodus.

Wat Gemini 2.5 in het bijzonder onderscheidt is gesprekscontext. Oudere vertaalmachines behandelen elke zin als een onafhankelijke tekenreeks. Daarom krijg je soms voornaamwoorden die naar het verkeerde zelfstandig naamwoord worden vertaald, of formaliteitsniveaus die halverwege een gesprek omslaan, of idiomen die als letterlijke onzin uitkomen. Gemini 2.5 ziet de vorige paar beurten en vertaalt de volgende met die context in acht genomen. Het resultaat voelt minder als een zin-voor-zin opzoekactie en meer als een tolk die het hele gesprek al in de kamer aanwezig is geweest.

Wat dit betekent voor welke paren het beste aanvoelen

Alle 10.506 paren werken. Sommige voelen vloeiender aan dan andere. Drie factoren bepalen de ervaring van een bepaald paar in de praktijk:

Waarom we van engine zijn gewisseld

De korte versie: de taaldekking en kwaliteit die we vroeger kregen van Deepgram + Google Cloud Translation was uitstekend bij de lancering, maar schaalden niet meer op toen we meer van de wereld wilden dekken. Scribe v2 wordt geleverd met bredere streamingdekking bij lagere latentie, Gemini 2.5 draagt context mee over beurten, en ElevenLabs v3 ontsloot de stemweergave die we nodig hadden voor Audio mode. De lange versie staat in een apart bericht met latencies, benchmarks en de architecturale beslissingen achter de overstap.

Probeer het

Kies je twee talen en start een realtime tweetalig gesprek. Geen app om te downloaden. Vertaalcredits beginnen bij $1 voor 15 minuten in de marquee; in Audio mode is transcriptie gratis totdat je op Vertalen tikt.

Start in de marquee · Probeer Audio mode · Volledige taalreferentie · Bekijk prijzen


Probeer Live Translate Live

Begin vandaag met het realtime vertalen van tweetalige gesprekken.

Gratis aan de slag