Googleは、最新のAIモデル「Gemini」を活用し、同社の翻訳機能と音声関連機能の大規模なアップグレードを実施しました。中でも特に注目すべきは、これまでGoogle Pixel Budsに限定されていたライブ音声翻訳機能が、Bluetooth接続された「あらゆるヘッドホン」で利用可能になるベータ版の登場です。
まずテキスト翻訳においては、Geminiの能力がGoogle翻訳に導入され、翻訳精度が向上しました。単なる直訳ではなく、「stealing my thunder」のような英語のイディオムを文脈から解析し、「私の手柄を横取りする」といった自然な日本語に訳すなど、ニュアンスの理解が深まっています。この機能は米国とインドを皮切りに、AndroidおよびiOSのアプリ、ウェブ版などで順次提供が開始されており、約20言語間の翻訳に対応しています。
今回のアップデートの最大の焦点は、ハードウェアの制約を取り払ったライブ音声翻訳です。この機能は、Geminiベースの音声生成AIモデル「Gemini 2.5 Flash Native Audio」によって実現されており、話者のトーン、強調、リズムといったニュアンスを保持したまま翻訳音声を生成できる点が特徴です。これにより、言葉の意味だけでなく、発話者の感情や意図もより自然に伝わります。
利用方法は、手持ちのヘッドホンをAndroidスマートフォンに接続し、Google翻訳アプリで「ライブ翻訳」をタップするだけです。現在、このベータ版機能は米国、メキシコ、インドのAndroid向けに提供が開始され、70以上の言語をサポートしています。2026年にはiOS版およびその他の国々にも展開が予定されており、より多くのユーザーがこの革新的な機能を利用できるようになる見込みです。
Googleによる今回の動きは、特定のハードウェアへの依存から脱却し、ソフトウェアの力で高度な機能を広く提供する方向性を示しています。手持ちのデバイスでシームレスな多言語コミュニケーションが実現する未来は、旅行、国際ビジネス、学習など、多岐にわたるシーンでの活用が期待され、人々の交流をより豊かにする強力なツールとなるでしょう。
