চ্যাট-স্টাইল লাইভ ট্রান্সলেশন — একটি উল্লম্ব বার্তা দৃশ্য

মে ২০২৬

Live Translate Live সবসময় একটি কথোপকথনকে অনুভূমিক স্ক্রোলিং মার্কি হিসেবে দেখিয়েছে — দুটি টেক্সট স্ট্রিম স্ক্রিন জুড়ে ভেসে যায়, প্রতিটি বক্তার জন্য একটি সারি, বাস্তব জীবনের সাবটাইটেলের মতো। মার্কি এখনও প্রধান দৃশ্য, এবং অনেক পরিস্থিতিতে এটি ঠিক সঠিক আকার: মুখোমুখি বসে কথোপকথন, ঘরের অপর প্রান্তে একটি টিভি, OBS-এ পাইপ করা একটি ব্রাউজার সোর্স।

কিন্তু স্ক্রোলিং টেক্সটের একটি স্পষ্ট বৈশিষ্ট্য আছে — এটি স্ক্রোল করে। আপনি যে বাক্যটি মিস করেছেন সেটি চলে গেছে, বাম প্রান্তে সরে গেছে, এবং পিছনে ফেরার কোনো উপায় নেই। বেশ কয়েকজন পাঠক আমাদের কাছে ভিন্ন ভাষায় একই জিনিস চেয়েছেন: কথোপকথনটি কি শুধু সেখানে থাকতে পারে? একটি চ্যাট অ্যাপের মতো। বাবল যা স্ক্রিনে থাকে, সবচেয়ে নতুনটি নিচে, অতীতে স্ক্রোল করে ফিরে যাওয়ার বিকল্প সহ।

সেই দৃশ্যটি এই মাসে চালু হয়েছে। এটি মার্কির প্রতিস্থাপন নয় — উভয়ই লাইভ, উভয়ই একই ইঞ্জিনে চলে, এবং আপনি কথোপকথনের মাঝখানে তাদের মধ্যে স্যুইচ করতে পারেন। এটি কেবল একই অনুবাদের জন্য একটি ভিন্ন লেআউট, পাশ দিয়ে দেখার পরিবর্তে পড়ে যাওয়ার জন্য অপ্টিমাইজ করা।

একটি দ্বিতীয় লাইভ দৃশ্য, রিপ্লে নয়

প্রথমে যে বিষয়টি পরিষ্কার করা দরকার: এটি পুরনো অর্থে "ইতিহাস" নয়। আগে একটি আলাদা পেজ ছিল যেখানে আপনি পরে গিয়ে পুরনো কথোপকথন দেখতে পারতেন। সেই পেজটি এখনও আছে, এবং এটি এখন দ্বৈত দায়িত্ব পালন করে — যখন আপনার মাইক্রোফোন চালু থাকে, একই স্ক্রিনটি লাইভ দৃশ্য। নতুন অনুবাদ রিয়েল টাইমে আসে, একটি তাজা চ্যাট বাবল হিসেবে নিচে পড়ে, এবং সেখানে থাকে।

ভেতরে, কিছুই পরিবর্তন হয়নি। একই Deepgram স্পিচ রিকগনিশন দুটি সমান্তরাল স্ট্রিমে চলে — একটি আপনার ভাষার জন্য, একটি তাদের ভাষার জন্য। একই Google Cloud ট্রান্সলেশন রূপান্তর পরিচালনা করে। একই একযোগে দ্বিমুখী অনুবাদ মানে উভয় ব্যক্তি পালা না নিয়ে স্বাভাবিক গতিতে কথা বলতে পারেন। সমস্ত ৪৭টি সমর্থিত ভাষা যেকোনো লেআউটে কাজ করে।

যা পরিবর্তন হয় তা হল জ্যামিতি। মার্কি অনুভূমিক গতি ব্যবহার করে বোঝাতে যে "এটি এখন ঘটছে।" চ্যাট দৃশ্য উল্লম্ব স্তুপ ব্যবহার করে বোঝাতে যে "এটি বলা হয়েছিল, এবং নতুন জিনিস নিচে পড়ে।" সময় সম্পর্কে ভিন্ন অনুভূতি, একই অন্তর্নিহিত ডেটা।

চ্যাট লেআউট কীভাবে কাজ করে

চ্যাট দৃশ্য খুলুন এবং একটি মাইক্রোফোন সেশন যেকোনো মেসেঞ্জার অ্যাপ থেকে আপনি যেভাবে আশা করবেন সেভাবে কাজ করে। বাবল উল্লম্বভাবে স্তুপ হয়, সবচেয়ে নতুনটি নিচে। আপনি একটি রঙ পান; তারা আরেকটি পান, প্রতিটি বাবলে একটি ছোট লেবেল চিপ সহ যাতে কে কী বলেছে তা স্পষ্ট থাকে। নতুন বাবল আসার সাথে সাথে দৃশ্যটি নিজেই স্ক্রোল করে যাতে আপনাকে নিচের প্রান্ত অনুসরণ করতে না হয় — কিন্তু আপনি লাইভ ফিড না ভেঙে স্বাধীনভাবে উপরে স্ক্রোল করতে পারেন।

একটি বাবল একটি বাক্য, একটি খণ্ড নয়। যখন একজন বক্তা বাক্যের মাঝখানে থাকেন, তাদের বর্তমান বাবল জায়গায় আপডেট হয় — রিকগনাইজার শব্দগুলি চূড়ান্ত করার সাথে সাথে শব্দ প্রদর্শিত হয়, যেন কেউ টাইপ করছে দেখছেন। বাক্য শেষ হলে, বাবলটি চূড়ান্ত হয় এবং পরবর্তী বাক্য নিচে একটি নতুন বাবল খোলে। সীমানা দুটি উপায়ে সনাক্ত করা হয়: স্পিচ ইঞ্জিন থেকে একটি "বার্স্ট এন্ড" সংকেত যখন বক্তা একটি স্বাভাবিক বিরতিতে পৌঁছান, অথবা প্রায় তিন সেকেন্ড নীরবতার পরে একটি ফলব্যাক টাইমআউট। যেভাবেই হোক আপনি প্রতিটি চিন্তার জন্য একটি বাবল পান, যা আপনি পরে কথোপকথনে স্ক্রোল করে ফিরে গেলে চান।

অনুবাদ মূলের চেয়ে সামান্য পিছিয়ে স্ট্রিম করে। অনুবাদ চলমান থাকাকালীন, আপনি মূল বাক্যের নিচে ইটালিকে অনুবাদ হচ্ছে… দেখতে পান। এটি পৌঁছালে, প্লেসহোল্ডারটি প্রতিস্থাপিত হয়। কোনো বিব্রতকর বিলম্ব নেই যেখানে বাবলটি ভাঙা দেখায় — আপনি সবসময় জানেন আপনি অনুবাদকের জন্য অপেক্ষা করছেন কিনা বা সত্যিই কিছু ব্যর্থ হয়েছে কিনা।

পুরনো কথোপকথনও সেখানে আছে। উপরে স্ক্রোল করুন, এবং পুরনো সেশনগুলি একবারে পঞ্চাশটি বার্তার পেজে লোড হয়, স্বয়ংক্রিয়ভাবে, যেভাবে একটি ইনফিনিট-স্ক্রোল চ্যাট ইতিহাস কাজ করে। কোনো আলাদা আর্কাইভ পেজ বা আমদানি পদক্ষেপ নেই। আজ সকালে, গত সপ্তাহে, গত মাসে আপনার করা কথোপকথন — সব লাইভটির উপরে স্তুপ করা, স্ক্রোল করে ফিরে যাওয়ার জন্য প্রস্তুত।

Push-to-Talk ঠিক মার্কিতে যেভাবে কাজ করে সেভাবেই কাজ করে — বোতাম ধরুন, কথা বলুন, ছেড়ে দিন। একই TAP AND HOLD TO TALK ওভারলে প্রদর্শিত হয়, একই শোরগোলের পরিবেশের আচরণ প্রযোজ্য। চ্যাট দৃশ্য মাইক্রোফোন কীভাবে আচরণ করে তা পরিবর্তন করে না; শুধু ফলাফল আপনার স্ক্রিনে কীভাবে পড়ে তা পরিবর্তন করে।

ট্রান্সলেশন-অনলি টগল

চ্যাট দৃশ্যের স্বাক্ষর UX পদক্ষেপটি ছোট এবং চেষ্টা না করা পর্যন্ত সহজে মিস হয়: যেকোনো চূড়ান্ত বাবলে ট্যাপ করুন এবং উৎস ভাষা সরে যায়। বাবলটি কেবল অনুবাদ রাখে, প্রাথমিক টেক্সট ওজনে প্রদর্শিত, এবং ছোট চিপ লেবেল আপডেট হয় আপনি এখন কোন ভাষা পড়ছেন তা দেখাতে — উদাহরণস্বরূপ, YOU-এর পরিবর্তে YOU (SPANISH)

আবার ট্যাপ করুন এবং উৎস ফিরে আসে, অনুবাদ একটি গৌণ লাইন হিসেবে নিচে বসে। কোনো মেনু নেই, কোনো সেটিংস ডাইভ নেই — বাবলটি নিজেই টগল। আমরা এটিকে অভ্যন্তরীণভাবে ট্রান্সলেশন-অনলি মোড বলি, এবং এটি চালু থাকলে, পুরো কথোপকথনটি একটি একক ভাষা স্ট্রিম হিসেবে পড়া যায়, যেভাবে হবে যদি আপনি একজন দক্ষ বক্তা হতেন যিনি সরাসরি ঘর শুনছেন।

সেটিংটি স্থায়ী। একবার আপনি এটি টগল করলে, কথোপকথনের প্রতিটি বাবল আপনার সাথে স্যুইচ করে, এবং পছন্দটি সেশন এবং ডিভাইস জুড়ে মনে রাখা হয় — আগামীকাল আপনার ফোনে অ্যাপ খুলুন এবং এটি আপনি যে মোডে রেখেছিলেন সেখানে থাকে। যখনই আপনি আবার উভয় ভাষা স্ক্রিনে চান তখন পাশাপাশি দৃশ্যে ফিরে যেতে আনটগল করুন।

দুটি প্যাটার্ন আমরা দেখেছি মানুষ পড়ে যাচ্ছে, উভয়ের জন্যই টগলটি ডিজাইন করা হয়েছিল:

এটি কার জন্য

আমরা একটি নির্দিষ্ট ব্যক্তিত্বকে মাথায় রেখে চ্যাট দৃশ্য তৈরি করিনি, এবং যে অনুরোধটি এটি প্রম্পট করেছিল তা একসাথে বেশ কয়েকটি ভিন্ন দিক থেকে এসেছিল। পাঠকের ইমেইলে চারটি ব্যবহারের ক্ষেত্র বারবার আসছে:

ভাষা শিক্ষার্থীরা

এটি সবচেয়ে উৎসাহী গোষ্ঠী। মার্কি অধ্যয়নের জন্য খুব দ্রুত স্ক্রোল করে — আপনি একটি বাক্যের সাথে বসে পুনরায় পড়তে পারবেন না। চ্যাট দৃশ্য বিপরীত: বাবল সেখানে থাকে যতক্ষণ না আপনি তাদের পেরিয়ে স্ক্রোল করেন। আপনার লক্ষ্য ভাষায় সেট করা ট্রান্সলেশন-অনলি টগলের সাথে এটি একত্রিত করুন, এবং আপনার কাছে একটি অসীম, স্ব-গতির বোধগম্য ইনপুটের স্ট্রিম আছে যা একটি বাস্তব কথোপকথন থেকে আঁকা যা আপনি ইতিমধ্যে করতে যাচ্ছিলেন। আপনি মিস করা একটি বাক্যে স্ক্রোল করুন, একটি বাক্যাংশ কপি করুন যা আপনি পরে অনুশীলন করতে চান, আপনার সময় নিন।

পারিবারিক কথোপকথন

ভাষার ব্যবধান সহ বহু-প্রজন্মের পরিবার — একজন দাদা-দাদি যিনি ক্যান্টোনিজ বলেন, একজন নাতি-নাতনি যিনি ইংরেজি বলেন, একজন অভিভাবক যিনি উভয়ই আধা-বলেন — বাবল থেকে বিশেষ সুবিধা পান যা অপেক্ষা করে। একজন বয়স্ক বক্তা যার একটি বাক্য তৈরি করতে একটু সময় লাগে তাদের পূর্ণ চিন্তা স্ক্রিনে বসে থাকে, অক্ষত, এমনকি যদি শ্রোতা বাক্যের মাঝখানে দূরে তাকিয়ে থাকেন। কাউকে কাউকে পুনরাবৃত্তি করতে বলতে হবে না। কথোপকথনের একটি রেকর্ড আছে যখন এটি ঘটছে, শুধু পরে নয়।

ব্যবসায়িক মিটিং ও অ্যাপয়েন্টমেন্ট

মিটিংয়ের জন্য — একটি বিক্রয় কল, একটি বিক্রেতার কথোপকথন, একজন ডাক্তারের অ্যাপয়েন্টমেন্ট, একটি ইমিগ্রেশন সাক্ষাৎকার — চ্যাট দৃশ্য মানুষ আসলে যে ট্রান্সক্রিপ্ট চায় তার কাছাকাছি। আপনি প্রবাহ না ভেঙে তিন মিনিট আগে কী বলা হয়েছিল তা ফিরে দেখতে পারেন। মিটিং শেষ হওয়ার পরে, আপনার কাছে স্ক্রিনে একটি সম্পূর্ণ রেকর্ড আছে, উভয় ভাষায়, পড়তে বা যার প্রয়োজন তাকে দিতে প্রস্তুত। উচ্চ-ঝুঁকির পরিস্থিতিতে একজন প্রত্যয়িত দোভাষী এখনও সঠিক পছন্দ, কিন্তু নিয়মিত দ্বিভাষিক মিটিংয়ের দীর্ঘ লেজের জন্য, চ্যাট ফর্মে কথোপকথন ক্যাপচার করা সত্যিই উপকারী।

অ্যাক্সেসিবিলিটি ও শ্রবণ

এক সেকেন্ডে অদৃশ্য হয়ে যাওয়া ক্যাপশন যে কারো জন্য একটি প্রতিকূল ইন্টারফেস যার শোনা কষ্টসাধ্য। পাঠক শ্রবণ প্রতিবন্ধী হোন, শোরগোলের পরিবেশে থাকুন, বা শুধু ঘরের চেয়ে একটু ধীরে কথ্য ভাষা প্রক্রিয়া করুন, চ্যাট লেআউট তাদের ক্যাপশন দেয় যা থাকে। প্রথমবার প্রতিটি শব্দ ধরার কোনো চাপ নেই। আপনি মিস করলে, উপরে স্ক্রোল করুন। এটি একই-ভাষা ট্রান্সক্রিপশন মোড-এর পিছনে একই প্রবৃত্তি — ক্যাপশন যা আপনি আপনার নিজের গতিতে পড়তে পারেন, বক্তার গতিতে নয়।

মার্কি বনাম চ্যাট — কোনটি ব্যবহার করবেন

উভয় দৃশ্যই লাইভ। উভয়ই একই বিল করে। উভয়ই একই ট্রান্সলেশন ইঞ্জিনে চলে। তাদের মধ্যে পছন্দ বেশিরভাগ আপনি যে ঘরে আছেন এবং আপনি কী ধরনের পড়া করতে চান তার উপর নির্ভর করে।

মার্কি (স্ক্রোলিং) চ্যাট (উল্লম্ব বার্তা)
লেআউট অনুভূমিক, দুটি সারি, টেক্সট ডান থেকে বামে স্ক্রোল করছে উল্লম্ব, স্তুপ করা বাবল, সবচেয়ে নতুনটি নিচে
স্থায়িত্ব স্ক্রোল করে চলে যায় — একবার স্ক্রিন ছেড়ে গেলে, চলে গেছে থাকে — যতদূর চান স্ক্রোল করুন, পুরনো সেশনেও
বাবল ইউনিট ক্রমাগত টেক্সট স্ট্রিম প্রতি বাবলে একটি বাক্য, স্বাভাবিক বিরতিতে চূড়ান্ত
সেরা জন্য মুখোমুখি বসে কথোপকথন, টিভি / প্রজেক্টর, OBS ব্রাউজার সোর্স, vis-à-vis মোড একক-স্ক্রিন পড়া, ভাষা অনুশীলন, মিটিং, অ্যাক্সেসিবিলিটি
ইন্টারঅ্যাকশন শুধু পড়া, পরিবেশগত ট্রান্সলেশন-অনলি মোড টগল করতে যেকোনো বাবলে ট্যাপ করুন
ইতিহাস অন্যত্র থাকে — চ্যাট দৃশ্যে পরে স্ক্রোল করুন অন্তর্নির্মিত — পুরনো কথোপকথন নতুনটির উপরে বসে

দুটি দ্রুত নিয়ম: আপনি এবং অন্য ব্যক্তি যদি একটি স্ক্রিন ভাগ করছেন — একটি টিভি, আপনাদের মাঝখানে টেবিলে একটি ল্যাপটপ, একটি প্রপ করা ফোন — মার্কি সম্ভবত সঠিক পছন্দ, এবং vis-à-vis মোড বিপরীত আসনের জন্য এটি কাজ করে। আপনি যদি একা স্ক্রিন দেখছেন — ডাক্তারের কাছে হাতে একটি ফোন, ভিডিও কলের সময় কোলে একটি ট্যাবলেট, মিটিংয়ের সময় খোলা একটি ল্যাপটপ — চ্যাট দৃশ্য ভালো পড়া যাবে।

আপনাকে প্রতিশ্রুতি দিতে হবে না। দুটি দৃশ্য একই সেশন এবং নিচে একই বাবল ভাগ করে। কথোপকথনের মাঝখানে স্যুইচ করুন; কিছুই হারায় না।

একই ইঞ্জিন, একই মূল্য

কোনো নতুন স্তর নেই, কোনো আপগ্রেড নেই, কোনো আলাদা বিলিং নেই। চ্যাট দৃশ্যের মার্কির মতো একই খরচ — দ্বিমুখী অনুবাদের ১৫ মিনিটের জন্য প্রায় $১, এক ঘণ্টার জন্য $৩, কোনো সাবস্ক্রিপশন নেই, ক্রেডিট কখনো মেয়াদ শেষ হয় না। আপনি শুধুমাত্র তখনই পেমেন্ট করেন যখন অডিও সক্রিয়ভাবে ট্রান্সক্রাইব এবং অনুবাদ করা হচ্ছে। পুরনো কথোপকথন পড়ে দেখতে কোনো খরচ নেই। গত সপ্তাহের চ্যাটে উপরে স্ক্রোল করা বিনামূল্যে।

আপনি যদি বেশিরভাগ একটি পর্যালোচনাযোগ্য ট্রান্সক্রিপ্ট চান এবং একটি সম্পূর্ণ দ্বিতীয় ট্রান্সলেশন পাইপলাইন নয়, একই-ভাষা মোড চ্যাট দৃশ্যেও কাজ করে — উভয় ভাষা একই সেট করুন, এবং ক্রেডিট প্রায় দশ গুণ বেশি প্রসারিত হয় কারণ কোনো দ্বিতীয় অনুবাদ পদক্ষেপ নেই।

FAQ

এটি কি একটি নতুন ফিচার, নাকি পুরনো ইতিহাস পেজের পুনর্নকশা?

উভয়ই। যে পেজটি আগে পুরনো কথোপকথনের একটি স্থির আর্কাইভ ছিল সেটি এখন একটি লাইভ দৃশ্যও। আপনার মাইক্রোফোন চালু করে খুলুন এবং নতুন অনুবাদ রিয়েল টাইমে নিচে আসে। মাইক্রোফোন বন্ধ করে খুলুন এবং এটি সবসময় যেভাবে আচরণ করত সেভাবে আচরণ করে — পুরনো সেশনের একটি রেকর্ড, স্ক্রোলযোগ্য। একই URL, একই ডেটা, বিস্তৃত আচরণ।

চ্যাট দৃশ্যের কি মার্কির চেয়ে বেশি খরচ?

না। এটি একই ইঞ্জিন একই হারে বিল করা হয়। আপনি যদি সেশনের মাঝখানে মার্কি থেকে চ্যাট দৃশ্যে স্যুইচ করেন, আপনার ক্রেডিট ব্যবহার ঠিক একই গতিতে চলতে থাকে। চ্যাট-স্টাইল ডিসপ্লের জন্য কোনো প্রিমিয়াম স্তর নেই।

আমি কি চ্যাট দৃশ্যে Push-to-Talk ব্যবহার করতে পারি?

হ্যাঁ। Push-to-Talk যেকোনো লেআউটে একইভাবে কাজ করে — বোতাম ধরুন, কথা বলুন, ছেড়ে দিন। চ্যাট দৃশ্য একই TAP AND HOLD TO TALK ওভারলে দেখায় যা আপনি অভ্যস্ত। PTT চ্যাট দৃশ্যে শোরগোলের পরিবেশে বিশেষভাবে উপকারী যেখানে আপনি কী ট্রান্সক্রাইব হবে এবং কী হবে না তার উপর স্পষ্ট নিয়ন্ত্রণ চান।

পুরনো কথোপকথনের কী হয়? আমি কি সেগুলো পেতে পারি?

পুরনো কথোপকথন লাইভটির উপরে স্তুপ করা। উপরে স্ক্রোল করুন এবং চ্যাট দৃশ্য পুরনো সেশনগুলি পেজে লোড করে, ইনফিনিট-স্ক্রোল স্টাইলে। আপনাকে কোনো তারিখ জানতে বা আর্কাইভ খুলতে হবে না — শুধু স্ক্রোল করুন। ট্রান্সলেশন-অনলি টগল পূর্ববর্তীভাবেও প্রযোজ্য, তাই আপনি যদি ট্রান্সলেশন-অনলি মোডে ফ্লিপ করেন এবং গত মাসের একটি কথোপকথনে স্ক্রোল করেন, এটি সেই বাবলগুলির অনুবাদিত দিক দেখায়, মূলটি নয়।

আমি কি কথোপকথনের মাঝখানে মার্কি এবং চ্যাট দৃশ্যের মধ্যে স্যুইচ করতে পারি?

হ্যাঁ। উভয় দৃশ্যই একই লাইভ সেশন দ্বারা চালিত, তাই তাদের মধ্যে অদলবদল করলে আপনার মাইক্রোফোন বাধাগ্রস্ত হয় না, বাবল পড়ে না, বা নিচে কিছু পুনরায় শুরু হয় না। যে মুহূর্তের জন্য যে লেআউট মানানসই তা বেছে নিন — ডাক্তারের অ্যাপয়েন্টমেন্টের জন্য রিড-অ্যালং চ্যাট, পরে ডিনার টেবিলের জন্য স্ক্রোলিং মার্কি — এবং ঘর পরিবর্তনের সাথে সাথে স্যুইচ করুন।

চেষ্টা করুন

চ্যাট দৃশ্য এখন প্রতিটি অ্যাকাউন্টের জন্য লাইভ। Live Translate Live খুলুন, সাইন ইন করুন, এবং কথোপকথন ইতিহাস পেজ খুঁজুন — আপনার মাইক্রোফোন সেশন স্বয়ংক্রিয়ভাবে চ্যাট ফর্মে সেখানে পৌঁছাবে। ট্রান্সলেশন-অনলি মোড চেষ্টা করতে একটি বাবলে ট্যাপ করুন। আপনার পুরনো কথোপকথন কতদূর পিছনে যায় তা দেখতে উপরে স্ক্রোল করুন।

$১-এ চেষ্টা করুন — কোনো সাবস্ক্রিপশন নেই · সমস্ত ফিচার দেখুন · মূল্য নির্ধারণ


Live Translate Live ব্যবহার করে দেখুন

আজই রিয়েল-টাইম দ্বিভাষিক কথোপকথন অনুবাদ শুরু করুন।

বিনামূল্যে শুরু করুন