OpenAI が ChatGPT の「 Advanced Voice Mode 」を大幅アップデート、リアルタイム翻訳機能を強化

投稿者:

OpenAI は、 ChatGPT の有料ユーザー向けに「 Advanced Voice Mode (アドバンスト・ボイス・モード)」の大幅なアップデートを実施しました。このアップデートにより、 AI の音声がより自然で表現豊かになり、リアルタイムの多言語翻訳機能も大幅に強化されています。

最も注目すべき改善点は、音声の自然さと表現力の向上です。声のイントネーションや抑揚がより人間らしく進化し、会話の間や強調、感情表現の幅が大幅に広がりました。共感や皮肉といった微妙なニュアンスも適切に表現できるようになり、従来の「ロボット的」な印象から、まるで人間と話しているような自然な対話体験へと進化しています。

新たに追加されたリアルタイム翻訳機能は、特に実用性の高い機能として注目されています。会話中に「翻訳して」と指示すると、以降は自動的に指定した言語間で翻訳を継続します。例えば、海外旅行でレストランを利用する際、英語からポルトガル語、または日本語から英語へのリアルタイム通訳が可能になります。この機能により、言語の壁を感じることなく、スムーズな国際コミュニケーションが実現できます。

技術的な基盤として、このアップデートは OpenAI の最新モデル GPT-4o を活用しています。テキスト、音声、ビジュアルデータを同一のニューラルネットワークで処理することで、低遅延かつ自然な対話を実現しており、ユーザーからは「レスポンス時間が 200 ミリ秒以下で驚異的」といった評価も寄せられています。

利用方法は簡単で、 ChatGPT の有料プラン( Plus 、 Pro 、 Teams 、 Enterprise )ユーザーが対象となります。アプリのメッセージ入力欄右側のマイクアイコンから手軽に利用でき、 iOS ・ Android の最新バージョン、デスクトップアプリ、ウェブ版のすべてのプラットフォームで利用可能です。

このアップデートは、競争が激化する AI 音声アシスタント市場での OpenAI の地位を強化する戦略的な動きとも言えます。 Google の Gemini や新興企業の Sesame など、自然な音声対話を提供する競合他社が増える中、 OpenAI は市場でのリーダーシップを維持するために機能強化を急いでいます。