Google が初のマルチエージェント AI 「 Gemini 2.5 Deep Think 」を公開

投稿者:

Google は 2025 年 8 月 1 日に、初の一般公開向けマルチエージェント AI モデル「 Gemini 2.5 Deep Think 」を公開しました。この新しい AI は、複雑な問題解決に特化した「並列思考(パラレルシンキング)」機能を備え、複数の AI エージェントが同時に異なる仮説やアプローチを検討しながら最適解を導き出す仕組みを持っています。

Gemini 2.5 Deep Think の最大の特徴は、従来の単一エージェント型 AI モデルとは異なり、複数の内部エージェントが並行して稼働することです。これにより、問題に対して多角的なアプローチを同時に検討し、より深い洞察と創造的な解決策を提供できるとされています。モデルは複数の仮説を生成し、それらを評価、修正、統合して最終的な回答を導き出すプロセスを採用しており、人間の複雑な問題解決プロセスを模倣した構造となっています。

性能面では、このモデルは目覚ましい成果を挙げています。2025 年の国際数学オリンピック( IMO )では金メダルレベルの性能を達成し、6 問中 5 問を完璧に解答しました。また、各種ベンチマークテストでも優秀な成績を記録しており、 Humanity’s Last Exam では 34.8% ( OpenAI の o3 は 20.3% 、 xAI の Grok 4 は 25.4% )、 LiveCodeBench 6 では 87.6% ( Grok 4 は 79% 、 o3 は 72% )を記録し、競合モデルを上回る結果を示しています。

現在、 Gemini 2.5 Deep Think は Google AI Ultra プラン(月額 250 ドル(約 3 万 7000 円))の加入者向けに Gemini アプリで利用可能となっています。ユーザーは Gemini 2.5 Pro を選択し、プロンプトバーで「 Deep Think 」を有効にすることでアクセスできます。ただし、1 日あたりのクエリ数には制限が設けられており、具体的な上限は公開されていません。

技術的な側面では、 Deep Think は Tree-of-Thoughts や Multi-Agent Alignment 戦略を採用し、複数の推論経路を同時に探索します。従来のモデルが数秒から数分で回答するのに対し、 Deep Think はより長い「思考時間」を確保し、複雑な問題に対して深く分析する設計となっています。また、 100 万トークンのコンテキストウィンドウを活用し、大量のデータや複雑なコードベースを処理することが可能です。

Google は今後、 Gemini API を通じてより多くの開発者に Deep Think を提供する計画で、企業や研究者向けの展開も予定されています。マルチエージェントシステムは、 xAI の Grok 4 Heavy や OpenAI の IMO モデルなど、主要 AI 開発企業でも採用が進んでおり、 AI の推論能力を強化する次世代技術として注目を集めています。