Live Translate Live সম্পর্কে
রিয়েল-টাইম দ্বিভাষিক কথোপকথন অনুবাদ, মুখোমুখি যোগাযোগের জন্য তৈরি।
Live Translate Live কী
Live Translate Live একটি ব্রাউজার-ভিত্তিক অ্যাপ্লিকেশন যা রিয়েল টাইমে কথোপকথনের উভয় দিক অনুবাদ করে এবং ফলাফল একটি স্ক্রোলিং মার্কি হিসেবে প্রদর্শন করে। যে দুজন মানুষ একই ভাষা জানেন না তারা স্বাভাবিকভাবে কথা বলতে পারেন — অ্যাপটি প্রতিটি বক্তার কথা শোনে, তাদের বক্তব্য লিপিবদ্ধ করে, অনুবাদ করে এবং কথোপকথন চলার সাথে সাথে মূল ও অনুবাদ উভয়ই স্ক্রিনে দেখায়।
এটি প্রথমত সামনাসামনি কথোপকথনের জন্য ডিজাইন করা হয়েছে: দুজনের মাঝে টেবিলে রাখা একটি ট্যাবলেট, এগিয়ে-পিছিয়ে দেওয়া একটি ফোন, বা একটি ঘরে মিরর করা টিভি। যেহেতু ডিসপ্লেটি পালাক্রমিক ট্রান্সক্রিপ্টের পরিবর্তে একটি স্ক্রোলিং মার্কি, তাই কোনো বক্তাকে থামতে বা অপেক্ষা করতে হয় না। কথোপকথন বক্তৃতার গতিতে এগিয়ে চলে।
কেন এটি তৈরি হয়েছে
বেশিরভাগ রিয়েল-টাইম অনুবাদ সরঞ্জাম ভার্চুয়াল মিটিংয়ের জন্য তৈরি — ভিডিও কলের উপরে ক্যাপশন, বা কোনো নির্দিষ্ট কনফারেন্স প্ল্যাটফর্মের সাথে যুক্ত ক্যাপশন। মুখোমুখি ক্ষেত্রটি অবহেলিত থেকে গেছে: একজন ডাক্তার যার রোগী ইংরেজি জানেন না, একজন ঠিকাদার যিনি এমন একজন গ্রাহকের কাছে যাচ্ছেন যার প্রথম ভাষা আলাদা, ভিন্ন দেশে বড় হওয়া দাদা-দাদি ও নাতি-নাতনি, বা এমন একটি দম্পতি যেখানে একজনের পরিবার অন্যজনের সাথে কোনো সাধারণ ভাষা ভাগ করে না।
Live Translate Live তৈরি হয়েছে সেই কথোপকথনগুলোকে স্বাভাবিক করতে। ফলাফল হলো একটি পে-অ্যাজ-ইউ-গো সরঞ্জাম যার খরচ প্রায় প্রতি মিনিটে $০.০৫, পেশাদার দোভাষীর তুলনায় যা প্রতি ঘণ্টায় $৫০ থেকে $১৫০, এটি যেকোনো দিকে ১০৩টি ভাষা সমর্থন করে (১০,৫০৬টি ভাষা-জুটির সমন্বয়, শুধু ইংরেজিতে বা ইংরেজি থেকে নয়), এবং একটি ওয়েব ব্রাউজার ছাড়া আর কিছুই প্রয়োজন নেই।
এটি কীভাবে তৈরি
অ্যাপটি সম্পূর্ণ ব্রাউজারে চলে। ইনস্টল করার কিছু নেই। পর্দার আড়ালে, ব্রাউজারের MediaRecorder API দিয়ে বক্তৃতা ধারণ করা হয় এবং WebSocket-এর মাধ্যমে একটি সার্ভারে স্ট্রিম করা হয় যা বক্তৃতা শনাক্তকরণের জন্য ElevenLabs Scribe v2 Realtime এবং অনুবাদের জন্য Google Gemini 2.5 ব্যবহার করে। স্ক্রোলিং মার্কিটি ক্লায়েন্ট-সাইডে রেন্ডার করা হয়। একটি একক Scribe সংযোগ উভয় বক্তাকে পরিচালনা করে — সার্ভার Scribe-এর নেটিভ ভাষা শনাক্তকরণ ব্যবহার করে প্রতিটি চূড়ান্ত বাক্যাংশকে "আপনার" বা "তাদের" হিসেবে শ্রেণীবদ্ধ করে (একই-স্ক্রিপ্ট জুটির জন্য Unicode-স্ক্রিপ্ট ও ট্রাইগ্রাম ফলব্যাক সহ), তাই কথোপকথনের উভয় দিক পালাক্রমে নয়, সমান্তরালে অনুবাদ হয়। audio mode বর্তমানে যে ৭৪টি ভাষা কভার করে তার জন্য ElevenLabs v3-এর মাধ্যমে কথ্য প্লেব্যাক যোগ করে।
পরিষেবাটি Stripe দ্বারা পরিচালিত একটি ক্রেডিট-ভিত্তিক বিলিং মডেল ব্যবহার করে। ক্রেডিটের মেয়াদ শেষ হয় না। কোনো সাবস্ক্রিপশন, স্তর বা ভাষা-জুটির প্রিমিয়াম নেই: প্রতিটি ভাষার খরচ একই।
এর পেছনে কারা আছেন
Live Translate Live তৈরি ও পরিচালনা করে Outdoor Devs, কানাডায় অবস্থিত একটি স্বাধীন ডেভেলপার দল। পরিষেবাটি কানাডিয়ান গোপনীয়তা আইন (PIPEDA) দ্বারা পরিচালিত এবং এই সাইটে পোস্ট করা পরিষেবার শর্তাবলী-এর অধীনে পরিচালিত হয়।
প্রকল্পটি শুরু হয়েছিল কারণ বিদ্যমান লাইভ-অনুবাদ বিকল্পগুলো হয় কোনো মিটিং প্ল্যাটফর্মে আটকে ছিল, ব্যয়বহুল হার্ডওয়্যার প্রয়োজন ছিল, অথবা যেকোনো ভাষা-জুটির মধ্যে দ্বিমুখী একযোগে অনুবাদ সমর্থন করত না। লক্ষ্য হলো এমন একটি সরঞ্জাম যা পথে বাধা হয়ে দাঁড়ায় না: একটি ব্রাউজার ট্যাব খুলুন, দুটি ভাষা বেছে নিন, কথা বলুন।
আমাদের সাথে যোগাযোগ করুন
সহায়তা, বিলিং প্রশ্ন বা মতামতের জন্য, সাইন ইন করুন এবং অ্যাপের মধ্যে যোগাযোগ ফর্ম ব্যবহার করুন। প্রেস বা অংশীদারিত্বের অনুসন্ধানের জন্যও একই চ্যানেল প্রযোজ্য।
চেষ্টা করুন
সর্বনিম্ন ক্রয় হলো ১৫ মিনিটের জন্য $১। ক্রেডিটের মেয়াদ কখনো শেষ হয় না।
শুরু করতে সাইন ইন করুন