【未来の翻訳】言葉の壁がなくなる日は近い?同時翻訳アプリの最前線

「言葉が通じたら、もっと世界は広がるのに…」そう思ったことはありませんか?海外旅行、国際会議、外国の映画や音楽。言葉の壁は、時に大きな障壁となります。

しかし今、その壁を打ち破る技術が急速に進化しています。それが「同時通訳アプリ」です。

これまでの翻訳アプリの多くは、話し終わってから翻訳が始まる「逐次通訳」が主流でした。しかし、まるで隣にいる通訳者のように、話しているそばからリアルタイムで翻訳してくれる「同時通訳」の技術開発が、今まさに進められているのです。

このブログでは、そんな夢のような技術、同時翻訳アプリの「今」と「これから」を、日本の研究機関や企業の取り組みを交えながらご紹介します。

同時通訳への期待と現状

私たちが日常で目にする翻訳技術は、多くが「逐次通訳」と呼ばれるものです。一文話し終えるのを待ってから、翻訳結果が表示されたり、音声で出力されたりするタイプですね。これはこれで非常に便利ですが、「会話の流れを止めずに、スムーズなコミュニケーションを取りたい」というニーズには、まだ十分に応えられていませんでした。

そこで期待が高まっているのが「同時通訳」です。話者の言葉を追いかけるように、ほぼリアルタイムで翻訳を行うこの技術は、まるでSF映画の世界。これが実現すれば、言語の壁を意識することなく、より自然で円滑なコミュニケーションが可能になるでしょう。

進化を牽引する日本の技術力

この「同時通訳」という夢の技術の実現に向けて、日本の研究機関や企業が精力的に開発を進めています。

国立研究開発法人情報通信研究機構(NICT)の挑戦

日本の公的研究機関であるNICTは、長年にわたり多言語自動翻訳技術の研究開発をリードしてきました。従来の短文の逐次翻訳から一歩進んで、会話の文脈や話者の意図まで汲み取った「同時通訳」の実現と社会実装を目指しています。

NICTの現在の技術は、1対1の短い対話であれば有効性が確認されていますが、本格的な同時通訳の実現にはまだ道半ばです。しかし、その実現に向けた基盤技術の開発は着実に進んでいます。具体的には、

  • 入力された発話から翻訳すべき単位を検出し、要点を絞り込み、効率的に単語を変換して訳出する技術
  • 翻訳単位だけでなく、それ以外の多様な情報(文脈など)を活用して通訳の精度を向上させる技術

といった、まさに同時通訳の肝となる部分の研究が進められています。さらに、実用化を見据え、

  • 自動同時通訳に適したユーザーインターフェース技術
  • 安定したサービスを提供するためのプラットフォーム技術

といった周辺技術の研究開発も同時に行われています。

NICTが開発した技術は、すでにライセンス契約を通じて30以上の民間サービスで活用されており、新型コロナウイルスワクチン接種会場での多言語案内に使われるなど、社会の緊急なニーズにも応えてきました。そして、2025年の大阪・関西万博を、日本の自動同時通訳技術を世界に披露するショーケースとすることを目指しています。

株式会社Kotoba Technologies Japanの躍進

一方、スタートアップ企業もこの分野で目覚ましい活躍を見せています。株式会社Kotoba Technologies Japanは、具体的なアプリケーション開発に注力しながら、基盤となるAI技術を磨いています。同社が目指すのは、例えば「日本語で話した内容が、そのまま自分の声で、瞬時に英語に翻訳される」といった、まさに未来の技術です。

具体的な取り組みとしては、

  • 独自の音声生成AI技術を駆使した同時通訳機能を持つiOSアプリ「同時通訳」の開発
  • 日本語を瞬時に英語へ翻訳し、英語の音声として出力する技術デモの開発(誰でも使える形での公開を目指しています)
  • 従来の日本語TTS(テキスト読み上げ)を超える、流暢で自然な音声生成を可能にする日本語音声生成モデルのプレイグラウンド「Kotoba SpeechGen」β版の公開(2024年10月)

などが挙げられます。 Kotoba Technologies Japanは、経済産業省主導の「GENIAC」プロジェクトに採択されたり、スーパーコンピューター「富岳」を使った国産LLM開発プロジェクト「Fugaku-LLM」に参加したりと、国内外の大学や企業との連携も深めながら、最先端のAI技術を社会に実装し、世界のAI分野に貢献することを目指しています。

同時通訳実現への高い壁

夢のような同時通訳技術ですが、その実現は決して簡単な道のりではありません。人間の言語活動の中でも最も高度とされる同時通訳は、自動翻訳システムにとって、スタートアップの中でも最も難易度の高い分野の一つと言われています。

具体的には、以下のような課題が横たわっています。

  • リアルタイム性の確保: 話者が話し終えるのを待たずに翻訳を開始するため、音声認識した言葉を「チャンク」と呼ばれる意味のまとまりに素早く分割し、その単位で翻訳する必要があります。
  • 語順の壁: 特に日本語と英語のように語順が大きく異なる言語間では、原文の語順のまま標準的な訳文を生成しようとすると、同時性の高い翻訳が非常に困難になります。実際の同時通訳者が行うように、原文の語順に近い訳文を生成する工夫が研究されています。
  • 処理の遅延: 音声認識、機械翻訳、テキスト音声合成という各ステップで発生する遅延をいかに最小化し、スムーズに連携させるかが重要です。これらの処理を段階的に、かつ並行して行う技術の統合が進められています。
  • 評価基準の未確立: 同時通訳の品質を測るための標準的な評価基準や、細かい部分ごとの評価指標がまだ確立されていません。
  • データと学習の課題: 高度なニューラル機械翻訳は、大量の学習データを必要とします。しかし、大規模な対訳データが存在しない場合や、少数言語、方言やスラングといった独自性の高い言葉遣い(口語)、そして言葉の裏にある深い意味や文脈の理解を必要とする翻訳には、多くの難問が残されています。
  • システム全体の統合: 各モジュール(音声認識、翻訳、音声合成など)の精度をそれぞれ向上させるだけでなく、それらを効果的に統合する方法を見つけ出すことが、システム全体の性能向上にとって重要な課題となっています。

これらの課題を一つ一つクリアしていくことが、実用的な自動同時通訳システムを実現するための鍵となります。

言葉の壁がなくなる未来に向けて

同時翻訳技術は、多くの困難な課題を抱えながらも、NICTやKotoba Technologies Japanのような情熱を持った組織や企業の努力によって、着実に未来へと歩みを進めています。

AI技術の進化は目覚ましく、これまで不可能だと思われていたことが次々と現実のものとなっています。日本語で話した声がそのまま、瞬時に、自然な外国語として相手に届く。そんな未来が、もうすぐそこまで来ているのかもしれません。

もちろん、人間の通訳者が持つような高度なニュアンスの理解や、臨機応変な対応までAIが完全に代替できるようになるには、まだ時間が必要でしょう。しかし、日常会話やビジネスシーンでのコミュニケーションを劇的に変える可能性を、同時翻訳技術は秘めています。

2025年の大阪・関西万博が一つのマイルストーンとなり、日本の技術が世界を驚かせる日が来ることを期待しつつ、今後の技術の進化に注目していきましょう。

あなたは、同時翻訳アプリが実現したら、どんなことに使ってみたいですか?

Comments

No comments yet. Why don’t you start the discussion?

    コメントを残す

    メールアドレスが公開されることはありません。 が付いている欄は必須項目です