একই-ভাষা মোড — ১০ গুণ কম খরচে রিয়েল-টাইম ট্রান্সক্রিপশন
মার্চ ২০২৬
Live Translate Live দুটি ভাষার মধ্যে রিয়েল-টাইম অনুবাদের জন্য তৈরি — কিন্তু একই ইঞ্জিন প্রায় দুর্ঘটনাক্রমে একটি ভিন্ন সমস্যার সমাধান করে। আপনার উৎস ও লক্ষ্য ভাষা একই মানে সেট করুন এবং অ্যাপটি একই-ভাষা ট্রান্সক্রিপশন মোডে চলে যাবে: একটি একক পূর্ণ-স্ক্রিন স্ক্রোলিং marquee যা কোনো অনুবাদ ধাপ ছাড়াই লাইভ স্পিচ-টু-টেক্সট ক্যাপশন প্রদর্শন করে। ক্রেডিট ১০ গুণ ধীরে খরচ হয়, ডিসপ্লে বড় হয়, এবং টুলটি নিঃশব্দে ব্রাউজারে চালানো যায় এমন সবচেয়ে সস্তা লাইভ ক্যাপশনিং সেটআপগুলির একটিতে পরিণত হয়।
বেশিরভাগ মানুষ এটি একইভাবে আবিষ্কার করেন। তারা কিছু অনুবাদ করতে সাইন আপ করেন — আত্মীয়দের সফর, একটি চিকিৎসা অ্যাপয়েন্টমেন্ট, একটি স্ট্রিম — এবং তারপর বুঝতে পারেন তাদের জীবনের আরও স্থায়ী সমস্যা হলো ঘরের কেউ টিভির শব্দ শুনতে পাচ্ছেন না। অথবা মিটিং। অথবা সামনের ঘরের বক্তা। একই-ভাষা মোড সেটিংসে সবসময় লুকিয়ে থাকা উত্তর ছিল।
যে মুহূর্তে সব পরিষ্কার হয়
একজন ব্যবহারকারী সম্প্রতি একটি সহজ বিবরণ লিখেছেন: "আমার মায়ের শ্রবণশক্তি কম। আমরা একসাথে ব্রিটিশ রহস্য নাটক দেখি এবং উচ্চারণ ও সঙ্গীতের কারণে তিনি প্রতিটি পর্বের অর্ধেক মিস করেন। টিভির বিল্ট-ইন ক্যাপশন ক্যাপশন-সহ শোগুলির জন্য ঠিক আছে — কিন্তু আমরা যা দেখি তার অনেকটাই এমন উৎস থেকে স্ট্রিম করা হয় যেগুলো নির্ভরযোগ্যভাবে ক্যাপশন দেয় না, অথবা ক্যাপশন দেরিতে আসে, অথবা ভুল ভাষায় থাকে।" তিনি তার ফোনটি টিভির পাশে রাখলেন, উভয় ভাষা ইংরেজিতে সেট করলেন, এবং marquee-কে ছবির নিচে লাইভ ক্যাপশন স্ক্রোল করতে দিলেন। তার মা আবার অনুসরণ করতে পারছেন। এটাই এক অনুচ্ছেদে ব্যবহারের ক্ষেত্র।
এটি বারবার একই ধরনের: কেউ এমন বক্তৃতার জন্য ক্যাপশন দরকার যা অন্য কিছু দিয়ে ক্যাপশন করা হচ্ছে না। একজন দাদা যিনি নাতিকে স্কুলের রচনা পড়তে শুনছেন। একজন ম্যানেজার যিনি একটি স্টাফ মিটিং পরিচালনা করছেন যেখানে একজন কর্মচারীর অডিটরি প্রসেসিং ডিসঅর্ডার আছে। একজন পাদ্রি যার মণ্ডলীতে বেশ কয়েকজন শ্রবণ-প্রতিবন্ধী সদস্য আছেন। একটি সম্মেলনের বক্তৃতা যেখানে বক্তার উচ্চারণ বোঝা কঠিন। এর কোনোটিই অনুবাদের সমস্যা নয় — কিন্তু এটি একটি রিয়েল-টাইম স্পিচ-টু-টেক্সট সমস্যা, এবং অনুবাদ পাইপলাইন কিছু অনুবাদ করার আগে ঠিক এটাই করছে।
একই-ভাষা মোড কীভাবে সক্রিয় করবেন
ইনস্টল বা কনফিগার করার জন্য অতিরিক্ত কিছু নেই। Live Translate Live খুলুন, এবং "আপনার ভাষা" ও "তাদের ভাষা" উভয় ড্রপডাউন একই ভাষায় সেট করুন — উদাহরণস্বরূপ, উভয়ই ইংরেজিতে সেট করুন। ব্যস। অ্যাপটি স্বয়ংক্রিয়ভাবে মিলটি শনাক্ত করে এবং শুধুমাত্র-ট্রান্সক্রিপশন মোডে চলে যায়।
একই-ভাষা মোড সক্রিয় থাকলে, marquee একটি বিভক্ত দুই-সারির ডিসপ্লে থেকে একটি একক পূর্ণ-উচ্চতার প্যানেলে পরিবর্তিত হয়। শুধুমাত্র আপনার স্পিচ-টু-টেক্সট ট্রান্সক্রিপশন স্ক্রিনে স্ক্রোল করে — কোনো অনুবাদ সারি নেই, কোনো বিভক্ত লেআউট নেই, শুধু প্রায় দ্বিগুণ উল্লম্ব আকারে ক্যাপশনের একটি পরিষ্কার স্ট্রিম। একটি টিভি বা প্রজেক্টরে, সেই পার্থক্যটি "পাঠযোগ্য" এবং "সোফা থেকে পাঠযোগ্য"-এর মধ্যে পার্থক্য।
ক্রেডিট গণনা — কেন এটি ১০ গুণ সস্তা
অনুবাদ মোড দুটি সম্পূর্ণ স্পিচ-রিকগনিশন পাইপলাইন চালায় (প্রতিটি বক্তার জন্য একটি) এবং প্রতিটি বাক্যাংশের জন্য একটি Google Cloud Translation কল করে। একই-ভাষা মোড অনুবাদ কলটি সম্পূর্ণ বাদ দেয় এবং একটি একক স্পিচ-রিকগনিশন পাসে সংকুচিত হয়। আমাদের বিলিং এটি প্রতিফলিত করে: অনুবাদ মোড প্রতি সেকেন্ডে ১ ক্রেডিট চার্জ করে, একই-ভাষা মোড প্রতি ১০ সেকেন্ডে ১ ক্রেডিট চার্জ করে। একই ওয়ালেটে দশ গুণ বেশি সময়।
ডলারে বললে, একই ক্রেডিট প্যাকগুলি আপনি কোন মোডে আছেন তার উপর নির্ভর করে নাটকীয়ভাবে ভিন্ন রানটাইম কভার করে:
| মোড | ক্রেডিট / সেকেন্ড | $১ (৯০০ ক্রেডিট) | $৩ (~১১,০০০ ক্রেডিট) | সেরা ব্যবহার |
|---|---|---|---|---|
| অনুবাদ | ১ / সেকেন্ড | ~১৫ মিনিট | ~৩ ঘণ্টা | দুই বক্তা, ভিন্ন ভাষা |
| একই-ভাষা | ১ / ১০ সেকেন্ড | ~২.৫ ঘণ্টা | ~৩০ ঘণ্টা | ক্যাপশন, অ্যাক্সেসিবিলিটি, ট্রান্সক্রিপশন |
ক্রেডিট শুধুমাত্র তখনই বিল করা হয় যখন অডিও সক্রিয়ভাবে ট্রান্সক্রাইব করা হচ্ছে — নীরবতা এবং বিরতি দেওয়া সেশনগুলি ক্রেডিট খরচ করে না। প্রকৃত রানটাইম মানুষ কতটা ক্রমাগত কথা বলছেন তার উপর নির্ভর করে পরিবর্তিত হয়। সম্পূর্ণ ক্রেডিট-প্যাক তালিকার জন্য মূল্য নির্ধারণ দেখুন।
এক ডলারে আপনি সারা বিকেল ক্যাপশন-সহ টিভি দেখতে পাবেন। তিন ডলারে কাজের সপ্তাহের বেশিরভাগ সময় Zoom ক্যাপশন পাবেন। মূল্য নির্ধারণ এখনও পে-অ্যাজ-ইউ-গো এবং ক্রেডিট মেয়াদ শেষ হয় না, তাই একই প্যাক যা এক বছরের মাঝে মাঝে ক্যাপশনিং সেশন তহবিল করে তা প্রয়োজনে মাঝে মাঝে অনুবাদ কথোপকথনও কভার করে।
ব্যবহারের ক্ষেত্র — কারা আসলে এটি ব্যবহার করছেন
ব্যবহারের ক্ষেত্রের তালিকা ছোট শুরু হয়েছিল এবং ক্রমশ বাড়ছে। কিছু ধরন বিস্তারিতভাবে বর্ণনা করার মতো স্পষ্টভাবে উঠে এসেছে:
বাড়িতে অ্যাক্সেসিবিলিটি
এটি সবচেয়ে বড় একক গোষ্ঠী। শ্রবণশক্তি কম এমন একজন পরিবারের সদস্য, এমন একটি পরিবার যারা ভালোভাবে ক্যাপশন না করা স্ট্রিমিং সেবার জন্য ক্যাপশন চায়, অথবা একটি কোলাহলপূর্ণ রান্নাঘরে কথোপকথনের দৃশ্যমানভাবে শক্তিশালী সংস্করণ যেখানে ডিশওয়াশার চলছে। সেটআপ প্রায় সবসময় একই: টিভির পাশে (বা নিচে) একটি স্ট্যান্ডে ফোন বা ট্যাবলেট, টিভি স্পিকারের দিকে তাক করা, উভয় ভাষা একই মানে সেট করা এবং marquee স্ক্রিন ভরে আছে। ক্রেডিট এত দীর্ঘস্থায়ী যে আপনি ভুলে যেতে পারেন এটি চলছে।
একটি বৈচিত্র্য: বিদেশী-ভাষার বিষয়বস্তু তার মূল ভাষায় ক্যাপশন করা। মূল ফরাসি অডিও সহ একটি ফরাসি চলচ্চিত্র দেখছেন? ফরাসিতে সেট করা একই-ভাষা মোড আপনাকে লাইভ ফরাসি ক্যাপশন দেয় এমনকি যখন স্ট্রিমিং সেবা শুধুমাত্র ইংরেজি সাবটাইটেল অফার করে। এটি পেশাদারভাবে তৈরি সাবটাইটেলের বিকল্প নয়, কিন্তু অস্ক্রিপ্টেড বা বিরল বিষয়বস্তুর জন্য এটি প্রায়ই কিছু না থাকার বিকল্পকে হারায়।
Zoom, Google Meet এবং অন্যান্য মিটিং
Google Meet-এ ক্যাপশন আছে। Zoom-এ ক্যাপশন আছে। Teams-এ ক্যাপশন আছে। এগুলো সবই বেশ ভালো। তারা যা করে না তা হলো একটি দ্বিতীয় স্ক্রিনে দেখানো যেখানে আপনি হাতে লেখা নোট নেওয়ার সময় পড়তে পারেন, অথবা যেখানে শ্রবণশক্তি কম এমন একজন সহকর্মী কলের অ্যাক্টিভ-স্পিকার ফ্রেমিংয়ের সাথে লড়াই না করে সেগুলো দেখতে পারেন। আপনার ল্যাপটপের পাশে একটি ট্যাবলেটে চলমান একই-ভাষা মোড এটি সমাধান করে — এবং এটি বাহ্যিক স্পিকার থেকে অডিও পিক আপ করে যা প্ল্যাটফর্ম ক্যাপশন সিস্টেম প্রায়ই মিস করে (কনফারেন্স রুমের ওপারে স্পিকারফোনে কেউ, একজন রিমোট অংশগ্রহণকারী যার অডিও একটি Bluetooth পাক দিয়ে বাজানো হচ্ছে)।
একটি মিটিংয়ের সময় ক্যাপশন চালানো একটি আশ্চর্যজনকভাবে কার্যকর নোট-নেওয়ার সহায়তাও। যখন কেউ বলেন "QBR Q3-এর জন্য নির্ধারিত এবং সেটির SLA হলো 99.95" এবং ক্যাপশনগুলি আপনাকে শোনার সাথে সাথে শব্দগুলি দেখায়, তখন আপনার নিজের নোটে সঠিক সংক্ষিপ্ত রূপগুলি টেনে আনা অনেক সহজ। আপনার অ্যাকাউন্টে কথোপকথনের ইতিহাস পরবর্তী রেফারেন্সের জন্য সম্পূর্ণ ট্রান্সক্রিপ্ট সংরক্ষণ করে।
লাইভ ইভেন্ট এবং উপাসনালয়
একটি বড় ডিসপ্লেতে একই-ভাষা মোড — একটি প্রজেক্টর, একটি দেয়ালে মাউন্ট করা টিভি, ঘরের পিছনে একটি ডেডিকেটেড মনিটর — অ্যাপটিকে একটি হালকা লাইভ ক্যাপশনিং সিস্টেমে পরিণত করে। একটি রবিবারের সেবা পরিচালনাকারী একটি গির্জা শ্রবণ-প্রতিবন্ধী মণ্ডলীর সদস্যদের জন্য রিয়েল টাইমে উপদেশ স্ক্রোল করতে পারে। একটি সম্মেলন একটি পার্শ্ব স্ক্রিনে ক্যাপশন রাখতে পারে। একটি বোর্ড মিটিং দূরবর্তী শ্রোতাদের জন্য চেয়ারের মন্তব্য ক্যাপশন করতে পারে। মূল্য নির্ধারণ এটি ছোট সংস্থাগুলির জন্য সম্ভব করে তোলে যারা একটি ডেডিকেটেড CART সেবা বহন করতে পারত না — $৩ সাপ্তাহিক দুই ঘণ্টার সেবার এক মাস কভার করে এবং কিছু অবশিষ্ট থাকে।
OBS-এ স্ট্রিমিং
একই-ভাষা মোড একটি OBS ব্রাউজার সোর্স হিসেবে পরিষ্কারভাবে কাজ করে। সম্পূর্ণ ওয়াকথ্রুর জন্য OBS + স্মার্ট টিভি সেটআপ গাইড দেখুন — সংক্ষিপ্ত সংস্করণ হলো যে স্বতন্ত্র marquee URL যেকোনো অন্য ওভারলের মতো একটি ব্রাউজার সোর্স হিসেবে যোগ করা যায়, এবং উভয় ভাষা একই মানে সেট করলে আপনি একটি ইংরেজি (বা স্প্যানিশ, বা জাপানি) স্ট্রিমের জন্য একটি পরিষ্কার ক্যাপশনিং রিবন পাবেন। একক-সারির লেআউট আপনার গেম ফিড বা ওয়েবক্যামের জন্য আরও উল্লম্ব স্থান রাখে, এবং ১০ গুণ ক্রেডিট রেটের মানে একটি বহু-ঘণ্টার স্ট্রিমের খরচ পয়সায় পড়ে।
উচ্চারণ ও পরিভাষা শক্তিশালীকরণ
একই-ভাষা মোড এমন পরিস্থিতিতে সত্যিই উপকারী যেখানে বক্তৃতা আপনার জানা ভাষায় কিন্তু অনুসরণ করতে এখনও প্রচেষ্টা লাগে — একটি শক্তিশালী উচ্চারণ সহ একটি সম্মেলনের বক্তৃতা, অপরিচিত পরিভাষায় ভরা একটি প্রযুক্তিগত বক্তৃতা, একটি চিকিৎসা বা আইনি কথোপকথন যেখানে সঠিক শব্দগুলি গুরুত্বপূর্ণ। কথ্য রূপের পাশাপাশি লিখিত রূপ দেখা কানের মিস করা জিনিসগুলি ধরে: সঠিক নাম, ওষুধের নাম, আইনের ধারা নম্বর, সংক্ষিপ্ত রূপ। একটি ইংরেজি-ভাষার সম্মেলনে ইংরেজিভাষী অংশগ্রহণকারীরা প্রায়ই অনুবাদ ক্যাপশনের চেয়ে ক্যাপশন বেশি উপকারী মনে করেন, কারণ বাধাটি ভাষা নয়, এটি ঘনত্ব।
ডিভাইস সেটআপ — কোথায় কী কাজ করে
একই-ভাষা মোড ডিভাইস-অজ্ঞেয়বাদী, কিন্তু ব্যবহারের ক্ষেত্রের উপর নির্ভর করে কিছু সেটআপ অন্যদের চেয়ে ভালো কাজ করে:
- স্ট্যান্ডে ফোন, টিভির কাছে — সবচেয়ে সস্তা অ্যাক্সেসিবিলিটি সেটআপ। একটি $১০ ডেস্ক স্ট্যান্ড টিভির পাশে একটি ফোন সোজা রাখে যাতে উভয় ব্যক্তি কিছু না ধরেই ক্যাপশন দেখতে পারেন। ফোনের মাইক টিভির অডিও পিক আপ করে কাজ করে; ফোনটি টিভির Bluetooth-এ পেয়ার করলে বা একটি ওয়্যার্ড aux লাইন ব্যবহার করলে আরও ভালো কাজ করে।
- স্ট্যান্ডে ট্যাবলেট, ল্যাপটপের পাশে — মিটিংয়ের জন্য সেরা। marquee চালানো একটি ১০-ইঞ্চি ট্যাবলেট ল্যাপটপের স্ক্রিন রিয়েল এস্টেট না খেয়ে পাঠযোগ্য ক্যাপশন টেক্সট দেয়। ট্যাবলেটের নিজস্ব মাইক বা ল্যাপটপের মাইক ব্যবহার করুন; যেকোনোটি কাজ করে।
- ল্যাপটপ প্রপ আপ, দ্বিতীয় মনিটর — হোম অফিসের জন্য ভালো। একটি দ্বিতীয় মনিটরে স্বতন্ত্র marquee URL খুলুন যাতে এটি মূল স্ক্রিনে আপনি যা করছেন তা থেকে স্বাধীনভাবে চলে।
- Chromecast বা বিল্ট-ইন ব্রাউজারের মাধ্যমে স্মার্ট টিভি — লাইভ ইভেন্ট এবং উপাসনালয়ের জন্য সেরা। একটি ফোন থেকে স্বতন্ত্র marquee URL Chromecast করুন, অথবা টিভির ব্রাউজারে সরাসরি খুলুন যদি থাকে। পূর্ণ-স্ক্রিন একক-প্যানেল লেআউট ঠিক এই সেটআপের জন্য ডিজাইন করা হয়েছে।
- OBS ব্রাউজার সোর্স — স্ট্রিমারদের জন্য। স্বতন্ত্র marquee URL একটি ব্রাউজার সোর্স হিসেবে যোগ করুন এবং এটি একটি লোয়ার-থার্ড বা পূর্ণ-প্রস্থ রিবন হিসেবে অবস্থান করুন। সাধারণ স্ট্রিম দৈর্ঘ্যের জন্য ক্রেডিট খরচ নগণ্য।
সীমাবদ্ধতা — কী আশা করবেন
লাইভ স্পিচ-টু-টেক্সট কোথায় কম পড়ে সে সম্পর্কে সৎ থাকা মূল্যবান, কারণ একই-ভাষা মোড ক্যাপশনগুলি সরাসরি আপনার সামনে রাখে বরং একটি অনুবাদ স্তরে লুকিয়ে রাখার পরিবর্তে।
- সঠিক নাম, সংখ্যা এবং সংক্ষিপ্ত রূপ সবচেয়ে কঠিন শ্রেণির শব্দ। রাস্তার নাম, অপরিচিত পদবি, দীর্ঘ সংখ্যার স্ট্রিং, চিকিৎসা পরিভাষা, পণ্য SKU — এখানেই ত্রুটিগুলি জমা হয়। সাধারণ বক্তৃতা খুব নির্ভুল; বিশেষজ্ঞ শব্দভাণ্ডার এলোমেলো।
- কোনো স্পিকার ডায়ারাইজেশন নেই। marquee বক্তাদের মধ্যে পার্থক্য করে না। সবাই যা বলে তা একটি স্ট্রিমে প্রবাহিত হয়। এক-বক্তার পরিস্থিতির জন্য (একটি বক্তৃতা, একটি উপদেশ, একটি প্রভাবশালী কণ্ঠস্বর সহ একটি টিভি শো) এটি ঠিক আছে; পাঁচজন কথা বলা একটি রাউন্ডটেবিলের জন্য এটি একটি পাঠযোগ্য কিন্তু অ-আরোপিত ট্রান্সক্রিপ্ট তৈরি করে।
- বিরাম চিহ্ন অনুমান করা হয়, নিখুঁত নয়। স্পিচ ইঞ্জিন বিরতি এবং প্রসোডির উপর ভিত্তি করে পিরিয়ড এবং কমা রাখে। দীর্ঘ প্রবাহমান বাক্যগুলি কখনও কখনও একটি রান-অন হিসেবে আসে; ছোট ক্লিপড বাক্যাংশগুলি কখনও কখনও খণ্ড হিসেবে আসে। এটি পাঠযোগ্য কিন্তু প্রকাশনা-প্রস্তুত নয়।
- লেটেন্সি সাব-সেকেন্ড কিন্তু শূন্য নয়। ক্যাপশনগুলি কথ্য শব্দের প্রায় অর্ধ সেকেন্ড থেকে এক সেকেন্ড পরে প্রদর্শিত হবে বলে আশা করুন, ছোট স্পষ্ট বাক্যাংশের জন্য দ্রুত নিষ্পত্তি এবং দীর্ঘ বিচরণকারীদের জন্য ধীর নিষ্পত্তি সহ। এটি প্রতিটি লাইভ ক্যাপশনিং সিস্টেমের ক্ষেত্রে সত্য — মানব বা মেশিন — এবং সাধারণত বোঝার জন্য ঠিক আছে।
- পটভূমির শব্দ গুরুত্বপূর্ণ। পরিষ্কার অডিও ইন = পরিষ্কার ক্যাপশন আউট। একটি মৃদুভাষী টিভি থেকে ঘরের ওপারে রাখা ফোন একটি স্পষ্ট স্পিকার থেকে ছয় ইঞ্চি দূরে রাখা ফোনের চেয়ে খারাপ ক্যাপশন তৈরি করবে। নির্ভুলতা গুরুত্বপূর্ণ হলে, মাইক এবং উৎসের মধ্যে দূরত্ব কমান।
- কোনো অফলাইন মোড নেই। স্পিচ ইঞ্জিন ক্লাউডে চলে, তাই আপনার একটি ইন্টারনেট সংযোগ দরকার। এটি কিছু ব্যবহারের ক্ষেত্রে একটি বাস্তব সীমাবদ্ধতা এবং আগে থেকে জানা মূল্যবান।
ডেডিকেটেড ক্যাপশনিং অ্যাপের সাথে তুলনা
একই-ভাষা মোড একমাত্র রিয়েল-টাইম ক্যাপশনিং বিকল্প নয়। একটি ন্যায্য তুলনা:
- YouTube অটো-ক্যাপশন — বিনামূল্যে, চমৎকার, কিন্তু শুধুমাত্র YouTube-এ ইতিমধ্যে থাকা বিষয়বস্তুর জন্য কাজ করে। লাইভ টিভি, Zoom, ব্যক্তিগত কথোপকথন, বা YouTube ভিডিও নয় এমন কিছুর জন্য ভালো নয়।
- Otter.ai — শক্তিশালী স্পিকার ডায়ারাইজেশন এবং অনুসন্ধানযোগ্য ট্রান্সক্রিপ্ট সহ উদ্দেশ্য-নির্মিত ট্রান্সক্রিপশন টুল। পেশাদার মিটিং নোটের জন্য ভালো; আরও ব্যয়বহুল, সাবস্ক্রিপশন-ভিত্তিক, এবং পরিবেষ্টিত "একটি স্ক্রিনে ক্যাপশন রাখুন" ব্যবহারের ক্ষেত্রে কম উপযুক্ত।
- Google Meet / Zoom / Teams ক্যাপশন — বিনামূল্যে এবং ভালো, কিন্তু তাদের নিজ নিজ প্ল্যাটফর্মের মধ্যে আটকে আছে। স্পিকারের মাধ্যমে বাজানো পডকাস্ট, একটি টিভি শো, একটি ব্যক্তিগত কথোপকথন, বা একটি স্ট্রিম ক্যাপশন করতে পারে না।
- Live Transcribe (Android) / Live Captions (iOS, macOS, Windows) — চমৎকার অন-ডিভাইস বিকল্প যার ইন্টারনেটের প্রয়োজন নেই। গোপনীয়তা-সংবেদনশীল ব্যবহারের ক্ষেত্রে ভালো; কোনো শেয়ার্ড ডিসপ্লে মোড নেই এবং কোনো মাল্টি-ডিভাইস নমনীয়তা নেই।
Live Translate Live-এ একই-ভাষা মোড সেরা যখন আপনার যা দরকার তা হলো একটি শেয়ারযোগ্য, পাঠযোগ্য ক্যাপশনিং রিবন একটি স্ক্রিনে যা ঘরের যে কেউ দেখতে পারেন — একটি ব্যক্তিগত অন-ডিভাইস ক্যাপশন স্তর নয় এবং একটি প্ল্যাটফর্ম-নির্দিষ্ট মিটিং ফিচার নয়। এটি ইচ্ছাকৃতভাবে সেই টুলগুলির পরিপূরক, প্রতিস্থাপন নয়। আপনি যদি ইতিমধ্যে নিজের জন্য আপনার ল্যাপটপে Live Captions ভালোভাবে চালাচ্ছেন, তাহলে আপনার এটির দরকার নেই। আপনার যদি একটি ঘরের মানুষদের জন্য দেয়ালে ক্যাপশন দরকার হয়, তাহলে এটি পাওয়ার সবচেয়ে সহজ উপায়।
সচরাচর জিজ্ঞাসা
আমি কি একাধিক বক্তার সাথে এটি ব্যবহার করতে পারি?
হ্যাঁ, কিন্তু একটি সতর্কতা সহ। একাধিক ব্যক্তি একই মাইক্রোফোনে কথা বলতে পারেন এবং marquee সবকিছু একটি একক স্ট্রিমে ট্রান্সক্রাইব করবে। এটি কে কী বলেছে তা লেবেল করে না — কোনো স্পিকার ডায়ারাইজেশন নেই। মাঝে মাঝে মন্তব্য সহ একজন প্রভাবশালী বক্তার জন্য (একটি উপদেশ, একটি মিটিং চেয়ার, একজন শিক্ষক) এটি ভালো কাজ করে। একটি মুক্ত চার-পক্ষীয় কথোপকথনের জন্য এটি একটি পাঠযোগ্য ট্রান্সক্রিপ্ট তৈরি করে যা আরোপণ ছাড়াই সবাইকে একসাথে মিশিয়ে দেয়।
এটি কি অফলাইনে কাজ করে?
না। স্পিচ-রিকগনিশন পাইপলাইন ক্লাউডে চলে, তাই আপনার একটি ইন্টারনেট সংযোগ দরকার। অফলাইন ক্যাপশনিং একটি কঠোর প্রয়োজনীয়তা হলে, বিল্ট-ইন OS ক্যাপশনিং টুলগুলি (iOS / macOS / Windows-এ Live Captions, Android-এ Live Transcribe) অন-ডিভাইসে চলে এবং ব্যক্তিগত ব্যবহারের জন্য চমৎকার।
ট্রান্সক্রিপশন কতটা নির্ভুল?
সাধারণ বক্তৃতার পরিষ্কার অডিওর জন্য, নির্ভুলতা বেশি — YouTube অটো-ক্যাপশন এবং Google Meet ক্যাপশনের সাথে তুলনীয়, যা একই অন্তর্নিহিত ইঞ্জিন ব্যবহার করে। দুর্বল দিকগুলি হলো সঠিক নাম, সংখ্যা, সংক্ষিপ্ত রূপ, এবং ভারী উচ্চারণ বা ওভারল্যাপিং বক্তৃতা। নির্ভুলতা অডিও মানের সাথে স্কেল করে: বক্তার কাছে একটি ফোন ঘরের ওপারের ফোনের চেয়ে ভালো ক্যাপশন করবে।
আমি কি ট্রান্সক্রিপ্ট সংরক্ষণ করতে পারি?
হ্যাঁ। প্রতিটি সেশন আপনার কথোপকথনের ইতিহাসে সংরক্ষিত হয়, যা আপনি পরে পর্যালোচনা এবং রপ্তানি করতে পারেন। বর্তমান রপ্তানি বিকল্পগুলির জন্য ফিচার পেজ দেখুন। পাওয়ার ব্যবহারকারীদের জন্য, ইতিহাসে টাইমস্ট্যাম্প অন্তর্ভুক্ত রয়েছে, তাই আপনি এটি একটি লাইভ ক্যাপশনিং টুল এবং একটি পরবর্তী-সত্য ট্রান্সক্রিপশন টুল উভয় হিসেবে ব্যবহার করতে পারেন।
পূর্ণ-স্ক্রিন একক-প্যানেল ডিসপ্লে
অনুবাদ মোডে, marquee দুটি সারিতে বিভক্ত হয়: প্রতিটি ভাষার জন্য একটি। একই-ভাষা মোডে, স্ক্রোলিং টেক্সটের একটি একক সারির জন্য পুরো স্ক্রিন ব্যবহার করা হয়। এর মানে বড় টেক্সট এবং ভালো পাঠযোগ্যতা — বিশেষত উপকারী যখন ডিসপ্লে ঘরের ওপারে বা দেয়ালে প্রজেক্ট করা হয়।
বিদ্যমান সমস্ত marquee ফিচার এখনও কাজ করে: সামঞ্জস্যযোগ্য স্ক্রোল গতি, ফন্ট স্কেলিং, পুশ-টু-টক মোড, স্বতন্ত্র marquee URL, OBS ব্রাউজার সোর্স সামঞ্জস্যতা, এবং vis-à-vis ফ্লিপড-ডিসপ্লে মোড যদি আপনি টেবিলের উভয় পাশ থেকে পাঠযোগ্য ক্যাপশন চান। অনুবাদ মোড থেকে একমাত্র পার্থক্য হলো লেআউট — দুটির পরিবর্তে একটি সারি — এবং ক্রেডিট রেট।
আপনি ইতিমধ্যে যা ব্যবহার করেন তার সাথে কাজ করে
একই-ভাষা মোড একটি পৃথক ফিচার নয় — এটি একটি ভিন্ন কনফিগারেশনে একই অ্যাপ। আপনার সেট আপ করা সবকিছু কাজ করতে থাকে:
- স্বতন্ত্র marquee — একটি পৃথক ব্রাউজার ট্যাব বা উইন্ডোতে marquee খুলুন, অথবা একটি স্মার্ট টিভির সাথে URL শেয়ার করুন
- OBS ব্রাউজার সোর্স — আপনার বিদ্যমান OBS সেটআপ অপরিবর্তিত কাজ করে; marquee স্বয়ংক্রিয়ভাবে একক-প্যানেল মোডে স্যুইচ করে
- পুশ-টু-টক — ট্রান্সক্রাইব করতে বোতাম ধরুন, থামাতে ছেড়ে দিন
- কথোপকথনের ইতিহাস — সমস্ত ট্রান্সক্রিপশন পরবর্তী পর্যালোচনার জন্য আপনার ইতিহাসে সংরক্ষিত হয়
একটি ভিন্ন লক্ষ্য ভাষা নির্বাচন করে যেকোনো সময় অনুবাদ মোডে ফিরে যান। marquee দুই-সারির লেআউট পুনরুদ্ধার করবে এবং স্ট্যান্ডার্ড রেটে অনুবাদ পুনরায় শুরু করবে।
এখনই চেষ্টা করুন
Live Translate Live-এ সাইন ইন করুন, উভয় ভাষা একই মানে সেট করুন, এবং কথা বলা শুরু করুন। আপনি রিয়েল টাইমে আপনার কথা স্ক্রোল করা একটি একক পূর্ণ-স্ক্রিন marquee দেখবেন — একটি ভগ্নাংশ খরচে। আপনার অ্যাক্সেসিবিলিটির জন্য লাইভ ক্যাপশন, একটি উপস্থাপনা ডিসপ্লে, স্ট্রিমিং ওভারলে, বা শুধু স্ক্রিনে আপনার নিজের বক্তৃতা দেখার একটি উপায় দরকার হোক না কেন, একই-ভাষা মোড আপনাকে কভার করেছে।
$১-এ চেষ্টা করুন — কোনো সাবস্ক্রিপশন নেই। ক্রেডিট মেয়াদ শেষ হয় না, তাই একটি প্যাক মাসের মাঝে মাঝে ক্যাপশনিং কভার করে। ব্রডকাস্ট সেটআপের সম্পূর্ণ ওয়াকথ্রুর জন্য, OBS এবং স্মার্ট টিভি গাইডে marquee দেখুন।
Live Translate Live ব্যবহার করে দেখুন
আজই রিয়েল-টাইম দ্বিভাষিক কথোপকথন অনুবাদ শুরু করুন।
বিনামূল্যে শুরু করুন