Google は、大規模言語モデル「 Gemini 2.5 Pro 」のアップデートを発表しました。同社が「これまでで最もインテリジェントなモデル」と称するこのアップデートは、コーディング、 STEM(科学・技術・工学・数学)、推論力、画像理解といった分野で大幅な性能向上を実現しています。
Gemini 2.5 Pro の最大の特徴は、従来の分類や予測中心のモデルから、「思考型モデル( thinking model )」への進化です。このモデルは問題を論理的に分析し、文脈やニュアンスを取り入れて結論を導き出す能力が強化されており、複雑な問題や曖昧な質問にも、より的確で納得感のある回答が可能になりました。
マルチモーダル対応も注目すべき進歩の一つです。テキスト、画像、音声、動画など複数のデータ形式をシームレスに処理できる能力を備え、最大 100 万トークン(今後は 200 万トークンに拡大予定)の長大なコンテキストを一度に扱えるため、長い会話や大規模データの解析にも対応します。
コーディング能力では飛躍的な向上を遂げており、 WebDev Arena や Aider Polyglot といった難易度の高い評価指標でリーダーボード首位を獲得しています。例えば、単一のプロンプトから実行可能なビデオゲームを生成したり、18 ファイルのコード変更を 45 分で完了したりする事例が報告されています。 Video to Code 機能では、 YouTube ビデオからインタラクティブな学習アプリを生成するといった新しいワークフローも実現しています。
STEM 分野のベンチマークでも他社モデルを大きく上回る成績を記録しています。 GPQA Diamond では 84.0% 、 AIME 2024 では 92.0% という高スコアを達成し、注目されています。
競合他社との比較では、 LMArena リーダーボードで 1470 の Elo スコアを獲得し、 OpenAI の o4 などを 35 ポイント上回ってトップに君臨しています。また、 Humanity’s Last Exam では 18.8% のスコアを獲得し、 OpenAI のモデル( 14% )を上回る結果を示しました。
現在、 Gemini 2.5 Pro は Google AI Studio で無料試用可能( 1 日 50 メッセージの制限あり)、 Gemini Advanced プラン(月額 20 ドル(約 2900 億円))の加入者向け Gemini アプリ、そして近日中に Vertex AI での一般提供が予定されています。開発者や企業は、コストやレイテンシーを細かく制御する「 thinking budgets 」機能も活用できます。