リアルタイム翻訳対応103言語 — あらゆる方向に対応

2026年5月更新

あなたの言語ペアに対応したリアルタイム翻訳アプリをお探しですか? Live Translate Live103言語に対応し、あらゆる方向への同時双方向翻訳を実現します。10,506通りの言語の組み合わせが可能で、すべての組み合わせで画面上のライブスクロール翻訳が利用でき、そのうち74言語ではAI音声再生も利用できます。言語ごとの精度ティアを含む完全な正式リファレンスは/languagesにあります。この記事ではリストを紹介し、各言語ペアに何を期待できるかを説明します。

対応言語の完全リスト

以下のすべての言語は、ソース言語としても対象言語としても使用できます。任意の2言語を選んで、リアルタイム翻訳によるバイリンガル会話を始めましょう。

  • アフリカーンス語
  • アルバニア語
  • アムハラ語
  • アラビア語
  • アルメニア語
  • アッサム語
  • アゼルバイジャン語
  • バシキール語
  • バスク語
  • ベラルーシ語
  • ベンガル語
  • ボスニア語
  • ブルトン語
  • ブルガリア語
  • ビルマ語
  • カタルーニャ語
  • 中国語(普通話)
  • 中国語(繁体字)
  • クロアチア語
  • チェコ語
  • デンマーク語
  • オランダ語
  • 英語
  • エストニア語
  • フェロー語
  • フィリピン語
  • フィンランド語
  • フランス語
  • フランス語(カナダ)
  • ガリシア語
  • ジョージア語
  • ドイツ語
  • ギリシャ語
  • グジャラート語
  • ハイチ・クレオール語
  • ハウサ語
  • ハワイ語
  • ヘブライ語
  • ヒンディー語
  • ハンガリー語
  • アイスランド語
  • インドネシア語
  • イタリア語
  • 日本語
  • ジャワ語
  • カンナダ語
  • カザフ語
  • クメール語
  • 韓国語
  • ラオ語
  • ラテン語
  • ラトビア語
  • リンガラ語
  • リトアニア語
  • ルクセンブルク語
  • マケドニア語
  • マダガスカル語
  • マレー語
  • マラヤーラム語
  • マルタ語
  • Māori語
  • マラーティー語
  • モンゴル語
  • ネパール語
  • ノルウェー語
  • ノルウェー語(ニーノシュク)
  • オック語
  • パシュトー語
  • ペルシャ語
  • ポーランド語
  • ポルトガル語
  • ポルトガル語(ポルトガル)
  • パンジャーブ語
  • ルーマニア語
  • ロシア語
  • サンスクリット語
  • セルビア語
  • ショナ語
  • シンド語
  • シンハラ語
  • スロバキア語
  • スロベニア語
  • ソマリ語
  • スペイン語
  • スンダ語
  • スワヒリ語
  • スウェーデン語
  • タガログ語
  • タジク語
  • タミル語
  • タタール語
  • テルグ語
  • タイ語
  • チベット語
  • トルコ語
  • トルクメン語
  • ウクライナ語
  • ウルドゥー語
  • ウズベク語
  • ベトナム語
  • ウェールズ語
  • イディッシュ語
  • ヨルバ語

音声認識と翻訳:2つの異なるレイヤー

ツールを比較する際に理解しておく価値のあることがあります。ライブ翻訳アプリにおける「言語サポート」とは、実際には2つの異なるものが重なり合っています。まずアプリはあなたが話した内容を認識しなければなりません(音声テキスト変換、またはASR)。次に、そのテキストを別の言語に翻訳しなければなりません(機械翻訳、またはMT)。これらは別々のシステムであり、カバー範囲も異なります。

Live Translate Liveは音声認識にElevenLabs Scribe v2 Realtimeを、翻訳にGoogle Gemini 2.5を使用しています。上記の103言語リストはScribe v2がストリーミングするものです。Gemini 2.5はそれらすべてに加え、テキスト翻訳側ではさらに多くの言語をカバーしています。ライブ音声翻訳のボトルネックはほぼ常に翻訳レイヤーではなくASRレイヤーです。

これが、Googleの翻訳テキストインターフェースには表示されていてもライブ音声アプリには対応していない言語が存在する理由です。テキスト翻訳はMTレイヤーだけで済みます。ライブ音声翻訳は、ストリーミング音声フィード上でミリ秒単位で、マイクが拾うアクセントや背景ノイズに関わらず、両方のレイヤーが機能する必要があります。ある言語が使用可能なストリーミングASR品質を下回った場合、会話の半分を誤って文字起こしするものを提供するよりも、対応外とする方を選びます。

ElevenLabsはScribe v2の4段階の単語誤り率(WER)グリッドを公開しています。Excellent(≤5%)、High(5–10%)、Good(10–15%)、Developing(15%+)です。アプリ内のピッカーでは各言語の横に色付きのドットでこれらのティアを表示しており、完全な内訳は/languagesにあります。新しいローンチ発表記事では、エンジンの切り替えとユーザーへの変更点について説明しています。

言語と地域バリアント

上記103言語の多くには複数の地域方言があります。単一モデルで処理されるものもあれば、選択可能な地域別バリアントがあるものもあり、一部の大きな語族はASRレイヤーで1つの主要バリアントに統合されます。最も一般的なものの内訳を以下に示します。

言語 地域バリアント 備考
スペイン語 単一モデル(イベリア半島とラテンアメリカに対応) Scribeは1つのモデルで両方の地域バリアントをきれいに処理します。地域ごとの語彙の違い(例:cochecarro)は文字起こしに保持され、翻訳者は他の言語へきれいに処理します。
ポルトガル語 pt(ブラジルデフォルト)、pt-PT(ヨーロッパ) ブラジルポルトガル語はトレーニングデータを支配しており、非常に信頼性高く文字起こしされます。ヨーロッパポルトガル語は選択可能なバリアントで、ポルトガルのユーザーやルゾフォノのアフリカ人話者に役立ちます。
フランス語 fr(デフォルト)、fr-CA(ケベック) ケベックフランス語は選択可能なバリアントです。デフォルトモデルはfr-FR、fr-BE、fr-CHをきれいに処理します。非常に強いケベックのスラングは、fr-CAバリアントを選択しない限り、文字起こしで標準フランス語に正規化されることがあります。
英語 単一モデル(US、UK、AU、IN、NZ、ZAのアクセント) 最も多くトレーニングされた言語で、主要なアクセント全体にわたって優れたカバレッジを持ちます。インド英語は特によく処理されます。
中国語 普通話(zh)、繁体字(zh-TW);広東語は独自のエントリとして 普通話が主要な音声ターゲットです。広東語はピッカーで独自の言語としてサポートされています。簡体字と繁体字の両方が翻訳側で正しくレンダリングされます。
アラビア語 現代標準アラビア語(主要) アラビア語はサポートされていますが、方言の処理は異なります。MSAが最も効果的です。エジプト、湾岸、レバント、マグレブの方言は精度が異なります。口語方言の音声は言語セット全体で最も難しいケースです。
ヒンディー語 / ウルドゥー語 hiur 話し言葉レベルでは言語的に非常に近いですが、異なる文字(デーヴァナーガリー対ナスタリーク)で書かれます。両方とも別々のASRターゲットとしてサポートされています。
ノルウェー語 no(ブークモール)、nn(ニーノシュク) ブークモールがデフォルトです。ニーノシュクはその書き言葉標準の話者向けに選択可能なバリアントです。
セルビア語 / クロアチア語 / ボスニア語 言語ごとに別々のモデル 話し言葉レベルでは相互に理解可能ですが、独自の文字と規範を持つ3つの別々の言語として扱われます。セルビア語はキリル文字とラテン文字の両方の出力をサポートしています。

ピッカーで特定の地域バリアントが提供されている場合、話者に合ったものを選ぶと文字起こしの精度が顕著に向上します。特にポルトガル語とフランス語で効果的です。

最もパフォーマンスの高い言語ペア

10,506通りのペアすべてが機能しますが、体感は同じではありません。特定のペアの実際の使用感を左右する3つの要因があります:

実際に最も速くスムーズに感じるペア:

うまく機能するが、各文が表示される前により目に見える「考え中」の状態が見られるペア:

「リアルタイム」が実際に意味すること

「リアルタイム」は曖昧な言葉なので、実際にどのように見えるかを説明します。話すと、単語がほぼ即座に画面に表示され始めます。認識エンジンが文をより多く聞くにつれて確定していく暫定テキストです。ElevenLabsはScribe v2の約150msのストリーミングレイテンシを公開しており、ほとんどの単語は話されてから約400〜800ms以内に表示されます。

翻訳は各文が確定した後に開始されます。Gemini 2.5は数百ミリ秒で翻訳を返し、前のターンを参照して会話のコンテキストを維持するという利点があります。「話者が文を終える」から「聞き手が翻訳を見る」までのエンドツーエンドのレイテンシは通常1秒未満です。

これが語順が重要な理由です。認識エンジンは話している間に喜んで暫定テキストを表示しますが、翻訳者は処理するための一貫した節が必要です。英語 ↔ スペイン語では、その節の境界は両言語でほぼ同じ場所に来ます。英語 ↔ 日本語ではそうではありません。これが日本語の翻訳がスペイン語よりもやや大きなまとまりで表示される理由です。

エッジケース:方言、文字、固有名詞

ライブ会話は単一言語の整然とした境界内に収まることはほとんどありません。よく発生するいくつかのエッジケースを挙げておきます。

コードスイッチング。バイリンガルの話者は文の途中で言語を混ぜることがよくあります。スパングリッシュ、ヒングリッシュ、フラングレなどです。アプリはほとんどの場合これをうまく処理し、話者が発話の途中で言語を切り替えても各言語を画面の正しい側に表示します。予測可能なコードスイッチングでは、話者ごとに1つの言語を割り当てておくと効果的です。偶発的な単語については、翻訳レイヤーが小さな文字起こしの癖を通常は許容します。

固有名詞と名前。人名、企業名、地名は辞書の分布に従わないため、ASRシステムにとって最も難しいものです。名前が音声的に奇妙に出力されることがあります。翻訳レイヤーは通常、固有名詞を翻訳せずにそのままにします。これは正しい動作です。「Guillermo」は英語でも「Guillermo」のままであるべきで、「William」になるべきではありません。重要な名前(医療の予約、法的な会話)については、一度名前を書いて見せることが助けになります。メニューから名前をキータームとして追加することもできます。Scribe v2はキータームプロンプティングをサポートしており、登録した名前を認識するようにエンジンを誘導します。

「翻訳不可能な」文化的用語。Schadenfreudesaudadehyggegiriなどの言葉は英語に対応する一語の表現がありません。Gemini 2.5は音訳(元の単語をそのまま保持)または言い換え(例:hyggeに対して「居心地のよい満足感」)を行います。言い換えは長くなることがあり、ソースの1語がターゲットで節になることがあります。これは予期された動作であり、バグではありません。

専門用語と業界語彙。医療用語、法律用語、製品名は翻訳者によって概ねうまく処理されますが、GoodまたはDevelopingの精度ティアの言語ではASRでつまずくことがあります。より小さな言語で専門的な会話にアプリを使用する場合、専門用語の文字起こしが不明瞭になることがあります。本当に安全性が重要な場合は、人間の通訳者が依然として正しい選択です。

多言語家庭。一方が一つの言語を話し、もう一方が別の言語で答えるバイリンガル家族の場合、Live Translate Liveの2ストリームアーキテクチャがこれをネイティブに処理します。誰がいつ話しているかに関わらず、各話者の会話の側が相手の言語に翻訳されます。

任意の言語から任意の言語へ

ほとんどの翻訳アプリは英語との間でしか翻訳しません。Live Translate Liveは異なります。103言語すべての間で任意の言語から任意の言語への翻訳をサポートしています。つまり、日本語とフランス語、アラビア語と韓国語、ヒンディー語とポルトガル語、ベトナム語とポーランド語、その他あらゆる組み合わせで直接翻訳できます。英語を介する必要はありません。

103言語と任意方向のペアリングにより、10,506通りのユニークな言語ペアが得られます。会話の両側が双方向翻訳で同時に翻訳されるため、どちらの話者も待つ必要がありません。

74言語でのライブAI音声(Audio mode)

スクロールするmarqueeに加えて、Audio modeではElevenLabs v3(対応言語向けのより高速な代替としてFlash v2.5も利用可能)を使用して、翻訳された文をデバイスのスピーカーから音声で再生します。サポートされている103言語のうち74言語でAI音声再生が利用可能です。残りの言語もAudio modeで動作しますが、音声再生なしで翻訳テキストが画面に表示されます。

Audio modeは、スクロールするディスプレイを読むことが実用的でない場合に適したツールです。市場、タクシー、病院の待合室など、自然に電話を渡し合う場所で活躍します。詳細はAudio modeの記事をご覧ください。

人気の言語ペア

すべての組み合わせが機能しますが、Live Translate Liveで最もよく使われるペアをいくつか紹介します:

お探しのペアが見当たりませんか?両言語が上記のサポートリストにあれば、一緒に使用できます。10,506通りの組み合わせすべてが完全にサポートされています。

よくある質問

アクセントに対応していますか?

はい、幅広い範囲に対応しています。Scribe v2は多様なアクセントデータでトレーニングされており、英語は特にUS、UK、オーストラリア、インド、南アフリカのアクセントをきれいに処理します。他の言語では、国内の強い地域アクセント(例えば濃い農村方言)はニュースキャスターの話し方よりもわずかに高いエラー率になりますが、2026年の全体的なトレンドとして、現代のASRは古いシステムよりもアクセントへの感度が顕著に低くなっています。特定の話者の認識が悪い場合、最も効果的な単一の改善策は通常、言語設定を変更することではなく、マイクの位置を改善することです。

対象言語に存在しない単語はどうなりますか?

Gemini 2.5は音訳(元の単語をそのまま保持し、対象言語の文字でレンダリングされることもある)または言い換え(意味を捉えた短いフレーズを使用)を行います。対象言語ですでに一般的な外来語(「computer」、「taxi」、「sushi」など)はそのまま通過させます。直接の対応語がない本当に文化固有の言葉については、言い換えが行われます。どちらの場合も会話が壊れることはありません。話者が発した文よりもわずかに長い文になることがあるだけです。

両方の話者が同じブラウザを使用する必要がありますか?

いいえ。Live Translate Liveはシングルスクリーンアプリです。通常のセットアップは1台のデバイスで2人が使用するもので、横並びに座るか、テーブルの反対側からディスプレイを読むvis-à-vis modeを使用します。2人目の話者に別途ログインやアプリのインストールは必要ありません。マイクの範囲内にいるだけで大丈夫です。部屋の反対側やテレビでのセットアップの場合、ディスプレイをキャストするか別の画面で開くことができます。

会話の途中で言語を切り替えることはできますか?

はい。言語ピッカーはライブで動作します。セッションを終了せずにいつでもどちらかの側の言語を変更できます。これは3人目が別の言語で会話に参加する場合や、バイリンガルの話者が途中で別の言語に切り替える場合に便利です。クレジットは切り替えをまたいで継続して消費されます。

あなたの言語ペアで試してみましょう

2つの言語を選んで、数秒でリアルタイムのバイリンガル会話を始めましょう。Live Translate Liveはブラウザで動作します。ダウンロード不要です。両方の話者が話しながらライブ翻訳を表示するスクロール翻訳ディスプレイを見ることができます。また、AI音声再生付きの1対1のハンドヘルド使用にはAudio modeに切り替えることもできます。

翻訳クレジットは15分わずか1ドルから。サブスクリプション不要です。

翻訳を始める · Audio mode · 言語リファレンス完全版 · 料金を見る


Live Translate Liveを試してみる

リアルタイムのバイリンガル会話の翻訳を今すぐ始めましょう。

無料で始める