Konuşmanın Her İki Tarafını da Çeviren Uygulama
Şubat 2026 · Nisan 2026'da Güncellendi
Çoğu çeviri uygulaması tek bir konuşmacı etrafında tasarlanmıştır. Bir kişi konuşur, uygulama çevirir, diğer kişi okur, ardından diğer kişi aynısını tersine yapar. Bir ya da iki cümle için işe yarar. İki kişi gerçekten konuşmaya çalıştığı anda çöker. Gerçek anlamda eş zamanlı iki yönlü çeviri için gereken teknoloji — her iki kişinin de doğal hızda konuştuğu, her iki çevirinin de ekranda canlı göründüğü — zaten mevcuttur ve bu, çoğu insanın denediği sıra tabanlı uygulamalardan belirgin biçimde farklı bir deneyimdir. Bu yazı uzun bir açıklamadır: arka planda gerçekte ne olduğu, sıra tabanlı uygulamaların neden yetersiz kaldığı ve bu farkın ne zaman önem taşıdığı.
Bu, teknoloji ve deneyim açıklayıcısıdır. Adım adım kurulum kılavuzu için bkz. Yüz Yüze Konuşma Nasıl Çevrilir. Belirli uygulamaların karşılaştırması için bkz. 2026'nın En İyi Canlı Çeviri Araçları. Paylaşılan ekran düzeni için bkz. Vis-à-Vis Yüz Yüze Çeviri Ekranı.
Sıra Tabanlı Sorun, Somut Olarak
Sıra tabanlı çeviri kâğıt üzerinde iyi görünür: A Kişisi konuşur, uygulama çevirir, B Kişisi okur, B Kişisi yanıt verir, uygulama çevirir, A Kişisi okur. Pratikte, iki kişi bu şekilde gerçek bir konuşma yapmaya çalıştığında aslında şunlar olur.
Birincisi, her konuşma biriminin ardından ölü hava oluşur. Konuşmacı durur. Uygulama son metni işlemek için bir ya da iki saniye döner. Ardından bir çeviri üretir. Dinleyici okur. Sonra dinleyici konuşur. Ardından döngü tekrar eder. Otuz saniyelik bir alışveriş doksan saniye sürer. Bu başlı başına dramatik değildir — ama birikerek büyür. Beş dakika sonra her iki kişi de bu ritimden yorulmuştur.
İkincisi, her iki konuşmacı da doğal olmayan biçimlerde uyum sağlar. Uygulama aynı anda yalnızca bir konuşma birimini işleyebildiğinden, insanlar düşüncelerini düzgün, kendi içinde tamamlanmış cümleler hâlinde paketlemeye başlar. Yavaşlarlar. Doğal konuşmanın küçük bağlayıcı dokusunu — "neyse", "yani şöyle", "ne demek istediğimi anlıyorsun", düşünce ortasında revize edilen sürüklenen ifadeleri — bırakırlar. Revizyonlu paragraflar yerine paragraflar hâlinde konuşurlar. Uygulama bunu ödüllendirir, konuşma bunun bedelini öder.
Üçüncüsü ve bu, çoğu insanın kaybolana kadar fark etmediği kısımdır: sıra tabanlı çeviri geri kanal iletişimini öldürür. Doğal konuşmada dinleyici sürekli sessiz sesler çıkarır — "hı-hı", "evet", "oh", "gerçekten mi?" — bunlar dikkat, onay, şaşkınlık ve kafa karışıklığını işaret eder. Bunlar konuşmacıyla örtüşür. Bir konuşmanın duygusal içeriğinin büyük bir bölümünü taşırlar. Sıra tabanlı bir uygulamada bunlar imkânsızdır. Dinleyicinin uygulama kendisine mikrofonu verene kadar sessiz kalması beklenir. Sonunda sıraları geldiğinde bu tepkiler bayatlamıştır.
Dördüncüsü, ton düzleşir. Sıra tabanlı uygulamalar ayrı cümleleri metne döker; biriyle birlikte konuşmaktan değil, birine karşı konuşmaktan gelen prozodi, tempo veya ipuçlarını aktarmaz. Sonunda dikkatli davranan birinin düz bir metnini okursunuz. Bir tıbbi randevu ya da aile ziyareti boyunca bu gerçek bir kayıptır.
Bunların hiçbiri sıra tabanlı uygulamalardaki bir hata değildir — bunlar tam olarak tasarlandıkları şeyi yapıyorlar: bir gezginin kahve sipariş etmesine ya da tren peronunu sormasına yardımcı olmak. Kısa, işlemsel alışverişler için gayet iyi çalışırlar. Sadece konuşma için tasarlanmamışlardır.
Eş Zamanlı İki Yönlü Çeviri Gerçekte Nasıl Çalışır
Live Translate Live gibi eş zamanlı iki dilli konuşma çevirmeni farklı bir mimari yaklaşım benimser. Her iki konuşmacının sırayla paylaştığı tek bir boru hattı yerine, paralel olarak iki bağımsız boru hattı çalıştırır — her dil yönü için bir tane — ve her ikisini tek bir ekranda gösterir.
Parçalar, kabaca mikrofondan ekrana sırasıyla:
- Tarayıcıda mikrofon yakalama. Konuşmacının tarayıcısı, standart MediaRecorder API'sini kullanarak tutarlı bir bit hızında ses yakalar. Eklenti yok, kurulum yok, yalnızca mikrofon erişimi isteyen bir web sayfası.
- WebSocket yükleme. Ses, gerçekleştikten sonra bütün dosyalar olarak yüklenmek yerine, küçük parçalar hâlinde — her biri saniyenin kesirleri — kalıcı bir WebSocket bağlantısı üzerinden sunucuya akar.
- Ham PCM'e kod çözme. Sunucuda, bir ffmpeg kod çözücü sıkıştırılmış tarayıcı sesini konuşma tanıma motorlarının beklediği 16 kHz'de ham PCM'e dönüştürür.
- İki Deepgram bağlantısı. Uygulama, Deepgram'ın akış konuşma tanıma hizmetine iki ayrı bağlantı açar — biri "sizinki" (konuşmacı A'nın dilini bekleyen) ve biri "onlarınki" (konuşmacı B'nin dilini bekleyen) olarak etiketlenir. Her boru hattı kendi dili için bağımsız olarak yapılandırılır ve gerçek zamanlı olarak metinler döndürür.
- Çeviri. Deepgram'dan metinler geldikçe, bunlar Google Cloud Translation aracılığıyla diğer konuşmacının diline aktarılır. Bu hızlıdır — kısa bir cümle için genellikle 200 ms'nin çok altında.
- Kayan ekran. Her iki çevrilmiş akış, Sunucu Tarafından Gönderilen Olaylar aracılığıyla istemciye iletilir ve tek bir kayan marquee üzerinde görüntülenir; böylece her iki konuşmacı da söylenenlerin canlı, sürekli bir metnini okuyabilecekleri dilde görür.
İki boru hattı tamamen bağımsız olduğundan, Konuşmacı A bir cümlenin ortasındayken Konuşmacı B zaten tepki veriyor olabilir. Hiçbirinin beklemesi gerekmez. Uygulama tek bir ses akışını iki mod arasında yönlendirmiyor — her zaman açık iki tanıyıcıyı paralel olarak çalıştırıyor ve çıktıyı birleştiriyor.
Sessizlik Algılama Durum Makinesi
Yüksek düzeyde açıklamaya değer bir ayrıntı, çünkü deneyimi çok etkiliyor: uygulama bir konuşmacının cümle ortasında duraklamak yerine gerçekten konuşmayı bıraktığını nasıl anlıyor? Live Translate Live, sunucu tarafındaki PCM sesinde her konuşmacıyı küçük bir durum kümesi üzerinden izleyen bir durum makinesi çalıştırır — kabaca dinleme, bekleyen-sessiz, sessiz ve tamponlama. Kelimeler arasındaki kısa duraklamalar "dinleme" durumunda kalır; ses enerjisindeki sürekli bir düşüş akışı "bekleyen-sessiz"e ve sonunda "sessiz"e yükseltir; bu, o segmenti sonlandırma ve çevirisini onaylama işaretidir. Gelen ses döngüyü yeniden başlatır. Sonuç olarak, biri nefes aldığında ekran yeniden oluşturulmaz, ancak konuşmacının mükemmel düzgün bir cümle üretmesini bekleyerek de durmaz. Bunu doğru yapmak, duyarlı hissettiren bir ekran ile titrek ya da yavaş hissettiren bir ekran arasındaki farktır.
Somut Bir Önce-Sonra: Büyükannenin Tıbbi Randevusu
Gerçek bir senaryoyu düşünün: bir torun, yalnızca Mandarin bilen büyükannesini bir kardiyoloji kontrol randevusuna götürüyor. Torun İngilizceyi akıcı konuşuyor, Mandarini ise kırık dökük. Büyükanne hiç İngilizce bilmiyor. Doktor kan basıncı ilacını ayarlamak ve yeni bir dozaj programını açıklamak istiyor.
Sıra tabanlı bir uygulamayla: Doktor bir cümle söyler. Torun telefonu kaldırır ve çeviri oluşturulurken bekler. Telefonu büyükannesine uzatır. Büyükanne çeviriyi okur, ardından telefona konuşur. Torun geri alır ve İngilizceyi okur. Doktora yanıt verir. Doktor bekler. Bunu yirmi dakikalık bir randevudaki her alışverişle çarpın. Büyükanne, herkesi yavaşlattığını hissettiği için yarı yolda ek sorular sormayı bırakır. Doktor, uygulamanın daha az şeyle uğraşması için bilgiyi daha az, daha uzun konuşma birimlerine sıkıştırmaya başlar. Torun, gerçek bir karşılıklı konuşma için tempo çok yavaş olduğundan çeviri yapmak yerine yanıtları özetler. Sonunda kimse yeni dozaj programının ne olduğundan tam olarak emin değildir.
Eş zamanlı iki yönlü çeviriyle: Torunun telefonu muayene masasında, ekranı her ikisine de dönük, kayan bir marquee çalıştırıyor. Doktor normal hızda konuşur. İngilizce metinler torun için kayar; Mandarin çevirileri büyükanne için kayar, her ikisi de aynı ekranda. Doktor "günde iki kez, yemekle birlikte" dediğinde büyükanne bunun sabah ve akşam mı yoksa her on iki saatte bir mi olduğunu sormak için sözü keser — ve Mandarin sorusu bir ya da iki saniye içinde İngilizce olarak doktorun görüşüne kayar. Doktor yanıtlar. Torunun tercüman oynamasına gerek kalmaz. Randevu zamanında biter ve herkes ilaç değişikliği hakkında aynı anlayışa sahiptir. Geri kaydırma korunur, böylece torun eve giderken tam dozaj talimatlarını inceleyebilir.
Eş Zamanlı Çevirinin Ne Zaman Önemli Olduğu, Ne Zaman Olmadığı
Dürüst yanıt: eş zamanlı çeviri her zaman kurulum zahmetine değmez. Bir dükkân sahibine tuvaletinin nerede olduğunu sormak istiyorsanız, telefonunuzdaki sıra tabanlı ücretsiz bir uygulama tamamen yeterlidir. Bir cümle girer, bir cümle çıkar, iki saniyelik gecikme, bitti. Paylaşılan bir ekranda kayan bir marquee açmak aşırıya kaçmak olur.
Fark, konuşmanın yalnızca iletmesi değil akması gereken her durumda önem kazanmaya başlar. Somut olarak:
- Tıbbi randevular. Takip soruları, tereddüt, bilgilendirilmiş onam ayrıntısı, duygusal içerik — bunların hepsi sıra tabanlı tempo tarafından soyulur.
- Aile ziyaretleri ve tatiller. Farklı bir dil konuşan büyükbaba ve büyükanneyle iki saatlik bir akşam yemeği. Sıra tabanlı uygulamalar insanların vazgeçip paralel izlerde konuşmasına neden olur. Eş zamanlı çeviri herkesin aynı konuşmada kalmasını sağlar.
- İş toplantıları ve satış görüşmeleri. Fiyat müzakeresinde nüans, itiraz, açıklayıcı sorular. Sıra tabanlı tempo size sinyal kaybettirir.
- Bir izleyici kitlesi için yayın ve altyazılar. Canlı konuşan bir yayıncının konuşma birimi konuşma birimi slaytlar değil, gerçek zamanlı kayan altyazılara ihtiyacı vardır. Bkz. OBS'de ve Akıllı TV'de Kayan Çeviri Marquee'si.
- Dil öğrenimi. Normal hızda kendilerini duymak isteyen, karşılaştırmak için kayan bir metne sahip pratik ortakları.
- Uzun hizmet etkileşimleri. Sosyal hizmet, göçmenlik görüşmeleri, veli-öğretmen toplantıları, hukuki kabul. Karşılıklı konuşmanın gerçek iş olduğu her şey.
Bunların herhangi biri için, sıra tabanlı bir uygulamanın temposu baskın sınırlama hâline gelir — doğruluktan, dil kapsamından, fiyattan daha fazla.
Bir Uygulamanın İki Yönlü Çevirinin Yanı Sıra İhtiyaç Duyduğu Diğer Şeyler
Eş zamanlı iki yönlü çeviri doğal konuşma için gereklidir ancak tek başına yeterli değildir. Pratikte birkaç başka ayrıntı da çok önem taşır:
- Paylaşılan ekran görüntüleme modu. Her iki konuşmacı da aynı ekrana bakabiliyorsa — masadaki bir telefon, bir dizüstü bilgisayar, bir TV — konuşma artık ileri geri geçirilen bir cihaz tarafından aracılanmaz. Vis-à-vis düzeni, karşılıklı oturan iki kişinin her ikisinin de düzgün okuyabilmesi için ekranın bir tarafını çevirir.
- "Mevcut cümle" görünümü değil, kayan marquee. Pek çok uygulama yalnızca en son çevrilmiş konuşma birimini gösterir; bu titrer ve kaybolur. Kayan bir marquee ekranda sürekli bir geçmiş tutar, böylece az önce söylenenlere bakabilirsiniz ve ekran hiçbir zaman boş kalmaz.
- Tek dilli transkripsiyon için kredi verimli mod. Bazen çeviri olmadan tek bir dilde canlı transkript isteyebilirsiniz — erişilebilirlik, yayın veya tek dilli bir konuşmayı altyazılama için. İyi tasarlanmış bir uygulama tek bir boru hattına düşürmenize ve buna göre faturalandırmanıza izin verir.
- Normal bir tarayıcıda çalışır. Uygulama mağazası kurulumu yok, sürücü yok, konuştuğunuz kişi için hesap oluşturma sürtüşmesi yok. Hiçbir şey yüklemeleri gerekmez — cihazı siz getirirsiniz.
- Her cihazda çalışır. Telefon, tablet, dizüstü bilgisayar, Chromecast bağlantılı TV. Mikrofon cebinizde; ekran tarayıcısı olan her şey olabilir.
- Tercüman kurulumu yok. Rezervasyon yok, planlama yok, saatlik minimum yok. Kullandığınız dakikalar için ödeme yaparsınız. Live Translate Live'da bu 15 dakika için 1 dolar, bir saat için 3 dolardır — bkz. fiyatlandırma.
- Konuşma geçmişi. Randevudan, toplantıdan, akşam yemeğinden sonra her iki dilde de metni yeniden okuyabilmeniz gerekir.
Yaygın Yanlış Anlamalar
"Google Translate bunu zaten yapmıyor mu?"
Google Translate'in Konuşma modu sıra tabanlıdır. İki kişinin aynı telefona sırayla konuşmasına, her iki dilde de çeviriler görünmesine izin verir. İki eş zamanlı boru hattı çalıştırmaz — her konuşma birimi sırayla işlenir ve konuşmacıların dönüşümlü olarak konuşması beklenir. Hızlı iki satırlık bir alışveriş için yeterlidir. Akıcı bir konuşma için, yukarıdaki sıra tabanlı bölümde açıklanan her sorunu yeniden üretir. Karşılaştırma yazısı farklılıkları daha ayrıntılı ele alıyor: 2026'nın En İyi Canlı Çeviri Araçları.
"İki ses konuşma tanıyıcıyı karıştırmaz mı?"
Bu en yaygın teknik endişedir ve insanların beklediğinden daha az sorun çıkardığı ortaya çıkar. İnsanların hayal ettiği tek cihazlı kurulumda, evet, iki örtüşen konuşmacıyı yakalayan tek bir mikrofon zorlanır. Ancak standart Live Translate Live kurulumu konuşmacı başına bir cihaz kullanır — her kişinin telefonu veya dizüstü bilgisayarı kendi sesini yakalar ve bu ses kendi Deepgram boru hattına akar. Çapraz kirlenme olmaz çünkü akışlar kaynakta fiziksel olarak ayrıdır. Her iki cihaz aynı odada olsa bile, yönlü mikrofon alımı ve sunucu tarafındaki sessizlik durum makinesi boru hatlarını temiz tutar. İki cihaz pratik olmadığında, dil algılamalı tek cihaz modu daha kısa alışverişler için çalışır.
"Gecikme ne olacak? Her zaman bir gecikme olmaz mı?"
Her zaman bir miktar gecikme vardır — soru ne kadar olduğudur. Deepgram, konuşma konuşulduktan birkaç yüz milisaniye içinde ara metinler döndürür ve kısa süre sonra sonlandırır. Google Cloud Translation, tipik bir cümle için üstüne yaklaşık 100–200 ms ekler. Kayan marquee veriler geldikçe oluşturulur, dolayısıyla ek "sonraki kareyi bekle" takılması yoktur. Uçtan uca, çevrilmiş metin genellikle kelimeler söylendikten bir saniye içinde ekranda görünmeye başlar ve konuşmacı cümleyi bitirirken kaymayı tamamlar. Bu, çoğu sıra tabanlı uygulamanın gösterdiği iki ila dört saniyelik boşluktan belirgin biçimde daha hızlıdır ve en önemlisi konuşmacıyla örtüşür, onlardan sonra gelmez.
"Çeviri bir insan tercüman kadar doğru mu?"
Hayır. Yüksek riskli hukuki, klinik veya diplomatik çalışmalar için sertifikalı bir insan tercüman hâlâ doğru seçimdir. Eş zamanlı iki yönlü çevirinin sunduğu şey, bir insan tercümanın genellikle sunamayacağı bir şeydir: 7/24 erişilebilirlik, dakika başı fiyatlandırma, herhangi bir dilden herhangi bir dile 47 dil, her iki tarafın da okuyabileceği paylaşılan ekran metni ve söylenenlerin aranabilir kaydı. Tercüman tutmanın pratik olmadığı uzun konuşmalar için — büyükannenin randevusu, bir satış görüşmesi, bir veli-öğretmen toplantısı — farklı bir kategoriye girer: bir profesyonelin yerini almaz, ancak konuşmayı mümkün kılan bir araçtır.
"Her iki kişinin de hesabı olması gerekiyor mu?"
Hayır. Oturumu yürüten kişinin bir hesaba ve kredilere ihtiyacı vardır; diğer konuşmacı sadece konuşur. Her iki taraf da daha iyi mikrofon izolasyonu için uygulamayı kendi cihazlarında çalıştırmak isterse bu da işe yarar, ancak yalnızca bir hesap kesinlikle gereklidir. Tam düzen için bkz. özellikler.
Bir Sonraki Konuşmanızda Deneyin
Bir konuşmanın her iki tarafını da çeviren bir uygulama arıyorsanız — gerçekten eş zamanlı, sıra tabanlı değil — Live Translate Live tam olarak bunun için tasarlanmıştır. İki paralel konuşma boru hattı, kayan marquee ekranı, herhangi bir dilden herhangi bir dile 47 dil, herhangi bir cihazda herhangi bir tarayıcıda çalışır. 1 dolarla deneyin — abonelik yok, krediler sona ermez.
İlgili Kılavuzlar
- Kurmaya hazır mısınız? Yüz Yüze Konuşma Nasıl Çevrilir — cihaz konumlandırma ipuçlarıyla adım adım kılavuz.
- Seçeneklerinizi mi karşılaştırıyorsunuz? 2026'nın En İyi Canlı Çeviri Araçları — bu kategorideki beş ana aracın yan yana karşılaştırması.
- Tek ekran mı paylaşıyorsunuz? Vis-à-Vis Yüz Yüze Çeviri Ekranı — masanın karşısındaki iki kişi için çevrilmiş düzen modu.
- Yayın mı yapıyorsunuz, sunum mu? OBS'de ve Akıllı TV'de Kayan Çeviri Marquee'si — çeviriyi paylaşılan bir ekrana koyun.
- Bir uygulamaya ihtiyacınız olup olmadığından emin değil misiniz? Başka Bir Dil Konuşan Biriyle Nasıl Konuşulur — araçların ne zaman yardımcı olduğu ve ne zaman olmadığı.
Live Translate Live'ı Deneyin
Gerçek zamanlı iki dilli konuşmaları çevirmeye bugün başlayın.
Ücretsiz Başla