একই-ভাষা মোড — ১০ গুণ কম খরচে রিয়েল-টাইম ট্রান্সক্রিপশন

মার্চ ২০২৬

Live Translate Live দুটি ভাষার মধ্যে রিয়েল-টাইম অনুবাদের জন্য তৈরি — কিন্তু একই ইঞ্জিন প্রায় দুর্ঘটনাক্রমে একটি ভিন্ন সমস্যার সমাধান করে। আপনার উৎস ও লক্ষ্য ভাষা একই মানে সেট করুন এবং অ্যাপটি একই-ভাষা ট্রান্সক্রিপশন মোডে চলে যাবে: একটি একক পূর্ণ-স্ক্রিন স্ক্রোলিং marquee যা কোনো অনুবাদ ধাপ ছাড়াই লাইভ স্পিচ-টু-টেক্সট ক্যাপশন প্রদর্শন করে। ক্রেডিট ১০ গুণ ধীরে খরচ হয়, ডিসপ্লে বড় হয়, এবং টুলটি নিঃশব্দে ব্রাউজারে চালানো যায় এমন সবচেয়ে সস্তা লাইভ ক্যাপশনিং সেটআপগুলির একটিতে পরিণত হয়।

বেশিরভাগ মানুষ এটি একইভাবে আবিষ্কার করেন। তারা কিছু অনুবাদ করতে সাইন আপ করেন — আত্মীয়দের সফর, একটি চিকিৎসা অ্যাপয়েন্টমেন্ট, একটি স্ট্রিম — এবং তারপর বুঝতে পারেন তাদের জীবনের আরও স্থায়ী সমস্যা হলো ঘরের কেউ টিভির শব্দ শুনতে পাচ্ছেন না। অথবা মিটিং। অথবা সামনের ঘরের বক্তা। একই-ভাষা মোড সেটিংসে সবসময় লুকিয়ে থাকা উত্তর ছিল।

যে মুহূর্তে সব পরিষ্কার হয়

একজন ব্যবহারকারী সম্প্রতি একটি সহজ বিবরণ লিখেছেন: "আমার মায়ের শ্রবণশক্তি কম। আমরা একসাথে ব্রিটিশ রহস্য নাটক দেখি এবং উচ্চারণ ও সঙ্গীতের কারণে তিনি প্রতিটি পর্বের অর্ধেক মিস করেন। টিভির বিল্ট-ইন ক্যাপশন ক্যাপশন-সহ শোগুলির জন্য ঠিক আছে — কিন্তু আমরা যা দেখি তার অনেকটাই এমন উৎস থেকে স্ট্রিম করা হয় যেগুলো নির্ভরযোগ্যভাবে ক্যাপশন দেয় না, অথবা ক্যাপশন দেরিতে আসে, অথবা ভুল ভাষায় থাকে।" তিনি তার ফোনটি টিভির পাশে রাখলেন, উভয় ভাষা ইংরেজিতে সেট করলেন, এবং marquee-কে ছবির নিচে লাইভ ক্যাপশন স্ক্রোল করতে দিলেন। তার মা আবার অনুসরণ করতে পারছেন। এটাই এক অনুচ্ছেদে ব্যবহারের ক্ষেত্র।

এটি বারবার একই ধরনের: কেউ এমন বক্তৃতার জন্য ক্যাপশন দরকার যা অন্য কিছু দিয়ে ক্যাপশন করা হচ্ছে না। একজন দাদা যিনি নাতিকে স্কুলের রচনা পড়তে শুনছেন। একজন ম্যানেজার যিনি একটি স্টাফ মিটিং পরিচালনা করছেন যেখানে একজন কর্মচারীর অডিটরি প্রসেসিং ডিসঅর্ডার আছে। একজন পাদ্রি যার মণ্ডলীতে বেশ কয়েকজন শ্রবণ-প্রতিবন্ধী সদস্য আছেন। একটি সম্মেলনের বক্তৃতা যেখানে বক্তার উচ্চারণ বোঝা কঠিন। এর কোনোটিই অনুবাদের সমস্যা নয় — কিন্তু এটি একটি রিয়েল-টাইম স্পিচ-টু-টেক্সট সমস্যা, এবং অনুবাদ পাইপলাইন কিছু অনুবাদ করার আগে ঠিক এটাই করছে।

একই-ভাষা মোড কীভাবে সক্রিয় করবেন

ইনস্টল বা কনফিগার করার জন্য অতিরিক্ত কিছু নেই। Live Translate Live খুলুন, এবং "আপনার ভাষা""তাদের ভাষা" উভয় ড্রপডাউন একই ভাষায় সেট করুন — উদাহরণস্বরূপ, উভয়ই ইংরেজিতে সেট করুন। ব্যস। অ্যাপটি স্বয়ংক্রিয়ভাবে মিলটি শনাক্ত করে এবং শুধুমাত্র-ট্রান্সক্রিপশন মোডে চলে যায়।

একই-ভাষা মোড সক্রিয় থাকলে, marquee একটি বিভক্ত দুই-সারির ডিসপ্লে থেকে একটি একক পূর্ণ-উচ্চতার প্যানেলে পরিবর্তিত হয়। শুধুমাত্র আপনার স্পিচ-টু-টেক্সট ট্রান্সক্রিপশন স্ক্রিনে স্ক্রোল করে — কোনো অনুবাদ সারি নেই, কোনো বিভক্ত লেআউট নেই, শুধু প্রায় দ্বিগুণ উল্লম্ব আকারে ক্যাপশনের একটি পরিষ্কার স্ট্রিম। একটি টিভি বা প্রজেক্টরে, সেই পার্থক্যটি "পাঠযোগ্য" এবং "সোফা থেকে পাঠযোগ্য"-এর মধ্যে পার্থক্য।

ক্রেডিট গণনা — কেন এটি ১০ গুণ সস্তা

অনুবাদ মোড দুটি সম্পূর্ণ স্পিচ-রিকগনিশন পাইপলাইন চালায় (প্রতিটি বক্তার জন্য একটি) এবং প্রতিটি বাক্যাংশের জন্য একটি Google Cloud Translation কল করে। একই-ভাষা মোড অনুবাদ কলটি সম্পূর্ণ বাদ দেয় এবং একটি একক স্পিচ-রিকগনিশন পাসে সংকুচিত হয়। আমাদের বিলিং এটি প্রতিফলিত করে: অনুবাদ মোড প্রতি সেকেন্ডে ১ ক্রেডিট চার্জ করে, একই-ভাষা মোড প্রতি ১০ সেকেন্ডে ১ ক্রেডিট চার্জ করে। একই ওয়ালেটে দশ গুণ বেশি সময়।

ডলারে বললে, একই ক্রেডিট প্যাকগুলি আপনি কোন মোডে আছেন তার উপর নির্ভর করে নাটকীয়ভাবে ভিন্ন রানটাইম কভার করে:

মোড ক্রেডিট / সেকেন্ড $১ (৯০০ ক্রেডিট) $৩ (~১১,০০০ ক্রেডিট) সেরা ব্যবহার
অনুবাদ ১ / সেকেন্ড ~১৫ মিনিট ~৩ ঘণ্টা দুই বক্তা, ভিন্ন ভাষা
একই-ভাষা ১ / ১০ সেকেন্ড ~২.৫ ঘণ্টা ~৩০ ঘণ্টা ক্যাপশন, অ্যাক্সেসিবিলিটি, ট্রান্সক্রিপশন

ক্রেডিট শুধুমাত্র তখনই বিল করা হয় যখন অডিও সক্রিয়ভাবে ট্রান্সক্রাইব করা হচ্ছে — নীরবতা এবং বিরতি দেওয়া সেশনগুলি ক্রেডিট খরচ করে না। প্রকৃত রানটাইম মানুষ কতটা ক্রমাগত কথা বলছেন তার উপর নির্ভর করে পরিবর্তিত হয়। সম্পূর্ণ ক্রেডিট-প্যাক তালিকার জন্য মূল্য নির্ধারণ দেখুন।

এক ডলারে আপনি সারা বিকেল ক্যাপশন-সহ টিভি দেখতে পাবেন। তিন ডলারে কাজের সপ্তাহের বেশিরভাগ সময় Zoom ক্যাপশন পাবেন। মূল্য নির্ধারণ এখনও পে-অ্যাজ-ইউ-গো এবং ক্রেডিট মেয়াদ শেষ হয় না, তাই একই প্যাক যা এক বছরের মাঝে মাঝে ক্যাপশনিং সেশন তহবিল করে তা প্রয়োজনে মাঝে মাঝে অনুবাদ কথোপকথনও কভার করে।

ব্যবহারের ক্ষেত্র — কারা আসলে এটি ব্যবহার করছেন

ব্যবহারের ক্ষেত্রের তালিকা ছোট শুরু হয়েছিল এবং ক্রমশ বাড়ছে। কিছু ধরন বিস্তারিতভাবে বর্ণনা করার মতো স্পষ্টভাবে উঠে এসেছে:

বাড়িতে অ্যাক্সেসিবিলিটি

এটি সবচেয়ে বড় একক গোষ্ঠী। শ্রবণশক্তি কম এমন একজন পরিবারের সদস্য, এমন একটি পরিবার যারা ভালোভাবে ক্যাপশন না করা স্ট্রিমিং সেবার জন্য ক্যাপশন চায়, অথবা একটি কোলাহলপূর্ণ রান্নাঘরে কথোপকথনের দৃশ্যমানভাবে শক্তিশালী সংস্করণ যেখানে ডিশওয়াশার চলছে। সেটআপ প্রায় সবসময় একই: টিভির পাশে (বা নিচে) একটি স্ট্যান্ডে ফোন বা ট্যাবলেট, টিভি স্পিকারের দিকে তাক করা, উভয় ভাষা একই মানে সেট করা এবং marquee স্ক্রিন ভরে আছে। ক্রেডিট এত দীর্ঘস্থায়ী যে আপনি ভুলে যেতে পারেন এটি চলছে।

একটি বৈচিত্র্য: বিদেশী-ভাষার বিষয়বস্তু তার মূল ভাষায় ক্যাপশন করা। মূল ফরাসি অডিও সহ একটি ফরাসি চলচ্চিত্র দেখছেন? ফরাসিতে সেট করা একই-ভাষা মোড আপনাকে লাইভ ফরাসি ক্যাপশন দেয় এমনকি যখন স্ট্রিমিং সেবা শুধুমাত্র ইংরেজি সাবটাইটেল অফার করে। এটি পেশাদারভাবে তৈরি সাবটাইটেলের বিকল্প নয়, কিন্তু অস্ক্রিপ্টেড বা বিরল বিষয়বস্তুর জন্য এটি প্রায়ই কিছু না থাকার বিকল্পকে হারায়।

Zoom, Google Meet এবং অন্যান্য মিটিং

Google Meet-এ ক্যাপশন আছে। Zoom-এ ক্যাপশন আছে। Teams-এ ক্যাপশন আছে। এগুলো সবই বেশ ভালো। তারা যা করে না তা হলো একটি দ্বিতীয় স্ক্রিনে দেখানো যেখানে আপনি হাতে লেখা নোট নেওয়ার সময় পড়তে পারেন, অথবা যেখানে শ্রবণশক্তি কম এমন একজন সহকর্মী কলের অ্যাক্টিভ-স্পিকার ফ্রেমিংয়ের সাথে লড়াই না করে সেগুলো দেখতে পারেন। আপনার ল্যাপটপের পাশে একটি ট্যাবলেটে চলমান একই-ভাষা মোড এটি সমাধান করে — এবং এটি বাহ্যিক স্পিকার থেকে অডিও পিক আপ করে যা প্ল্যাটফর্ম ক্যাপশন সিস্টেম প্রায়ই মিস করে (কনফারেন্স রুমের ওপারে স্পিকারফোনে কেউ, একজন রিমোট অংশগ্রহণকারী যার অডিও একটি Bluetooth পাক দিয়ে বাজানো হচ্ছে)।

একটি মিটিংয়ের সময় ক্যাপশন চালানো একটি আশ্চর্যজনকভাবে কার্যকর নোট-নেওয়ার সহায়তাও। যখন কেউ বলেন "QBR Q3-এর জন্য নির্ধারিত এবং সেটির SLA হলো 99.95" এবং ক্যাপশনগুলি আপনাকে শোনার সাথে সাথে শব্দগুলি দেখায়, তখন আপনার নিজের নোটে সঠিক সংক্ষিপ্ত রূপগুলি টেনে আনা অনেক সহজ। আপনার অ্যাকাউন্টে কথোপকথনের ইতিহাস পরবর্তী রেফারেন্সের জন্য সম্পূর্ণ ট্রান্সক্রিপ্ট সংরক্ষণ করে।

লাইভ ইভেন্ট এবং উপাসনালয়

একটি বড় ডিসপ্লেতে একই-ভাষা মোড — একটি প্রজেক্টর, একটি দেয়ালে মাউন্ট করা টিভি, ঘরের পিছনে একটি ডেডিকেটেড মনিটর — অ্যাপটিকে একটি হালকা লাইভ ক্যাপশনিং সিস্টেমে পরিণত করে। একটি রবিবারের সেবা পরিচালনাকারী একটি গির্জা শ্রবণ-প্রতিবন্ধী মণ্ডলীর সদস্যদের জন্য রিয়েল টাইমে উপদেশ স্ক্রোল করতে পারে। একটি সম্মেলন একটি পার্শ্ব স্ক্রিনে ক্যাপশন রাখতে পারে। একটি বোর্ড মিটিং দূরবর্তী শ্রোতাদের জন্য চেয়ারের মন্তব্য ক্যাপশন করতে পারে। মূল্য নির্ধারণ এটি ছোট সংস্থাগুলির জন্য সম্ভব করে তোলে যারা একটি ডেডিকেটেড CART সেবা বহন করতে পারত না — $৩ সাপ্তাহিক দুই ঘণ্টার সেবার এক মাস কভার করে এবং কিছু অবশিষ্ট থাকে।

OBS-এ স্ট্রিমিং

একই-ভাষা মোড একটি OBS ব্রাউজার সোর্স হিসেবে পরিষ্কারভাবে কাজ করে। সম্পূর্ণ ওয়াকথ্রুর জন্য OBS + স্মার্ট টিভি সেটআপ গাইড দেখুন — সংক্ষিপ্ত সংস্করণ হলো যে স্বতন্ত্র marquee URL যেকোনো অন্য ওভারলের মতো একটি ব্রাউজার সোর্স হিসেবে যোগ করা যায়, এবং উভয় ভাষা একই মানে সেট করলে আপনি একটি ইংরেজি (বা স্প্যানিশ, বা জাপানি) স্ট্রিমের জন্য একটি পরিষ্কার ক্যাপশনিং রিবন পাবেন। একক-সারির লেআউট আপনার গেম ফিড বা ওয়েবক্যামের জন্য আরও উল্লম্ব স্থান রাখে, এবং ১০ গুণ ক্রেডিট রেটের মানে একটি বহু-ঘণ্টার স্ট্রিমের খরচ পয়সায় পড়ে।

উচ্চারণ ও পরিভাষা শক্তিশালীকরণ

একই-ভাষা মোড এমন পরিস্থিতিতে সত্যিই উপকারী যেখানে বক্তৃতা আপনার জানা ভাষায় কিন্তু অনুসরণ করতে এখনও প্রচেষ্টা লাগে — একটি শক্তিশালী উচ্চারণ সহ একটি সম্মেলনের বক্তৃতা, অপরিচিত পরিভাষায় ভরা একটি প্রযুক্তিগত বক্তৃতা, একটি চিকিৎসা বা আইনি কথোপকথন যেখানে সঠিক শব্দগুলি গুরুত্বপূর্ণ। কথ্য রূপের পাশাপাশি লিখিত রূপ দেখা কানের মিস করা জিনিসগুলি ধরে: সঠিক নাম, ওষুধের নাম, আইনের ধারা নম্বর, সংক্ষিপ্ত রূপ। একটি ইংরেজি-ভাষার সম্মেলনে ইংরেজিভাষী অংশগ্রহণকারীরা প্রায়ই অনুবাদ ক্যাপশনের চেয়ে ক্যাপশন বেশি উপকারী মনে করেন, কারণ বাধাটি ভাষা নয়, এটি ঘনত্ব।

ডিভাইস সেটআপ — কোথায় কী কাজ করে

একই-ভাষা মোড ডিভাইস-অজ্ঞেয়বাদী, কিন্তু ব্যবহারের ক্ষেত্রের উপর নির্ভর করে কিছু সেটআপ অন্যদের চেয়ে ভালো কাজ করে:

সীমাবদ্ধতা — কী আশা করবেন

লাইভ স্পিচ-টু-টেক্সট কোথায় কম পড়ে সে সম্পর্কে সৎ থাকা মূল্যবান, কারণ একই-ভাষা মোড ক্যাপশনগুলি সরাসরি আপনার সামনে রাখে বরং একটি অনুবাদ স্তরে লুকিয়ে রাখার পরিবর্তে।

ডেডিকেটেড ক্যাপশনিং অ্যাপের সাথে তুলনা

একই-ভাষা মোড একমাত্র রিয়েল-টাইম ক্যাপশনিং বিকল্প নয়। একটি ন্যায্য তুলনা:

Live Translate Live-এ একই-ভাষা মোড সেরা যখন আপনার যা দরকার তা হলো একটি শেয়ারযোগ্য, পাঠযোগ্য ক্যাপশনিং রিবন একটি স্ক্রিনে যা ঘরের যে কেউ দেখতে পারেন — একটি ব্যক্তিগত অন-ডিভাইস ক্যাপশন স্তর নয় এবং একটি প্ল্যাটফর্ম-নির্দিষ্ট মিটিং ফিচার নয়। এটি ইচ্ছাকৃতভাবে সেই টুলগুলির পরিপূরক, প্রতিস্থাপন নয়। আপনি যদি ইতিমধ্যে নিজের জন্য আপনার ল্যাপটপে Live Captions ভালোভাবে চালাচ্ছেন, তাহলে আপনার এটির দরকার নেই। আপনার যদি একটি ঘরের মানুষদের জন্য দেয়ালে ক্যাপশন দরকার হয়, তাহলে এটি পাওয়ার সবচেয়ে সহজ উপায়।

সচরাচর জিজ্ঞাসা

আমি কি একাধিক বক্তার সাথে এটি ব্যবহার করতে পারি?

হ্যাঁ, কিন্তু একটি সতর্কতা সহ। একাধিক ব্যক্তি একই মাইক্রোফোনে কথা বলতে পারেন এবং marquee সবকিছু একটি একক স্ট্রিমে ট্রান্সক্রাইব করবে। এটি কে কী বলেছে তা লেবেল করে না — কোনো স্পিকার ডায়ারাইজেশন নেই। মাঝে মাঝে মন্তব্য সহ একজন প্রভাবশালী বক্তার জন্য (একটি উপদেশ, একটি মিটিং চেয়ার, একজন শিক্ষক) এটি ভালো কাজ করে। একটি মুক্ত চার-পক্ষীয় কথোপকথনের জন্য এটি একটি পাঠযোগ্য ট্রান্সক্রিপ্ট তৈরি করে যা আরোপণ ছাড়াই সবাইকে একসাথে মিশিয়ে দেয়।

এটি কি অফলাইনে কাজ করে?

না। স্পিচ-রিকগনিশন পাইপলাইন ক্লাউডে চলে, তাই আপনার একটি ইন্টারনেট সংযোগ দরকার। অফলাইন ক্যাপশনিং একটি কঠোর প্রয়োজনীয়তা হলে, বিল্ট-ইন OS ক্যাপশনিং টুলগুলি (iOS / macOS / Windows-এ Live Captions, Android-এ Live Transcribe) অন-ডিভাইসে চলে এবং ব্যক্তিগত ব্যবহারের জন্য চমৎকার।

ট্রান্সক্রিপশন কতটা নির্ভুল?

সাধারণ বক্তৃতার পরিষ্কার অডিওর জন্য, নির্ভুলতা বেশি — YouTube অটো-ক্যাপশন এবং Google Meet ক্যাপশনের সাথে তুলনীয়, যা একই অন্তর্নিহিত ইঞ্জিন ব্যবহার করে। দুর্বল দিকগুলি হলো সঠিক নাম, সংখ্যা, সংক্ষিপ্ত রূপ, এবং ভারী উচ্চারণ বা ওভারল্যাপিং বক্তৃতা। নির্ভুলতা অডিও মানের সাথে স্কেল করে: বক্তার কাছে একটি ফোন ঘরের ওপারের ফোনের চেয়ে ভালো ক্যাপশন করবে।

আমি কি ট্রান্সক্রিপ্ট সংরক্ষণ করতে পারি?

হ্যাঁ। প্রতিটি সেশন আপনার কথোপকথনের ইতিহাসে সংরক্ষিত হয়, যা আপনি পরে পর্যালোচনা এবং রপ্তানি করতে পারেন। বর্তমান রপ্তানি বিকল্পগুলির জন্য ফিচার পেজ দেখুন। পাওয়ার ব্যবহারকারীদের জন্য, ইতিহাসে টাইমস্ট্যাম্প অন্তর্ভুক্ত রয়েছে, তাই আপনি এটি একটি লাইভ ক্যাপশনিং টুল এবং একটি পরবর্তী-সত্য ট্রান্সক্রিপশন টুল উভয় হিসেবে ব্যবহার করতে পারেন।

পূর্ণ-স্ক্রিন একক-প্যানেল ডিসপ্লে

অনুবাদ মোডে, marquee দুটি সারিতে বিভক্ত হয়: প্রতিটি ভাষার জন্য একটি। একই-ভাষা মোডে, স্ক্রোলিং টেক্সটের একটি একক সারির জন্য পুরো স্ক্রিন ব্যবহার করা হয়। এর মানে বড় টেক্সট এবং ভালো পাঠযোগ্যতা — বিশেষত উপকারী যখন ডিসপ্লে ঘরের ওপারে বা দেয়ালে প্রজেক্ট করা হয়।

বিদ্যমান সমস্ত marquee ফিচার এখনও কাজ করে: সামঞ্জস্যযোগ্য স্ক্রোল গতি, ফন্ট স্কেলিং, পুশ-টু-টক মোড, স্বতন্ত্র marquee URL, OBS ব্রাউজার সোর্স সামঞ্জস্যতা, এবং vis-à-vis ফ্লিপড-ডিসপ্লে মোড যদি আপনি টেবিলের উভয় পাশ থেকে পাঠযোগ্য ক্যাপশন চান। অনুবাদ মোড থেকে একমাত্র পার্থক্য হলো লেআউট — দুটির পরিবর্তে একটি সারি — এবং ক্রেডিট রেট।

আপনি ইতিমধ্যে যা ব্যবহার করেন তার সাথে কাজ করে

একই-ভাষা মোড একটি পৃথক ফিচার নয় — এটি একটি ভিন্ন কনফিগারেশনে একই অ্যাপ। আপনার সেট আপ করা সবকিছু কাজ করতে থাকে:

একটি ভিন্ন লক্ষ্য ভাষা নির্বাচন করে যেকোনো সময় অনুবাদ মোডে ফিরে যান। marquee দুই-সারির লেআউট পুনরুদ্ধার করবে এবং স্ট্যান্ডার্ড রেটে অনুবাদ পুনরায় শুরু করবে।

এখনই চেষ্টা করুন

Live Translate Live-এ সাইন ইন করুন, উভয় ভাষা একই মানে সেট করুন, এবং কথা বলা শুরু করুন। আপনি রিয়েল টাইমে আপনার কথা স্ক্রোল করা একটি একক পূর্ণ-স্ক্রিন marquee দেখবেন — একটি ভগ্নাংশ খরচে। আপনার অ্যাক্সেসিবিলিটির জন্য লাইভ ক্যাপশন, একটি উপস্থাপনা ডিসপ্লে, স্ট্রিমিং ওভারলে, বা শুধু স্ক্রিনে আপনার নিজের বক্তৃতা দেখার একটি উপায় দরকার হোক না কেন, একই-ভাষা মোড আপনাকে কভার করেছে।

$১-এ চেষ্টা করুন — কোনো সাবস্ক্রিপশন নেই। ক্রেডিট মেয়াদ শেষ হয় না, তাই একটি প্যাক মাসের মাঝে মাঝে ক্যাপশনিং কভার করে। ব্রডকাস্ট সেটআপের সম্পূর্ণ ওয়াকথ্রুর জন্য, OBS এবং স্মার্ট টিভি গাইডে marquee দেখুন।


Live Translate Live ব্যবহার করে দেখুন

আজই রিয়েল-টাইম দ্বিভাষিক কথোপকথন অনুবাদ শুরু করুন।

বিনামূল্যে শুরু করুন