Google は 2026 年 2 月 12 日、科学・研究・エンジニアリング分野に特化した推論モデル「Gemini 3 Deep Think」の大型アップデートを発表しました。同日より Google AI Ultra サブスクライバー向けに提供が開始され、初めて Gemini API 経由での利用も可能になりました。
更新版は数学、コーディング、科学の各分野で目覚ましい性能を示しています。現代最先端モデルの限界をテストする「Humanity’s Last Exam」では 48.4% を達成し、2025 年国際数学オリンピアードでは金メダルレベルのパフォーマンスを記録しました。競技プログラミングベンチマーク Codeforces では 3455 Elo という驚異的なスコアを獲得し、トップティアの人間競技者レベルに到達しています。
抽象的推論ベンチマーク ARC-AGI-2 では 84.6% を達成し、次点の Claude Opus 4.6(68.8%)を 15.8 ポイント上回りました。物理オリンピアードと化学オリンピアードでも金メダル級の結果を記録しています。
Google は Deep Think を活用した数学研究エージェント「Aletheia」も構築しました。このシステムは可能な解決策を生成し、言語ベースの検証機能でチェックする反復プロセスを通じて、出版品質の研究成果を生み出しています。実際に ICLR ’26 への採択実績も報告されています。
実用面では、Rutgers 大学の数学者が人間の査読を通過していた論理的欠陥を特定したり、Duke 大学の研究室が半導体材料の製造方法を最適化するなど、研究現場での活用が進んでいます。
新バージョンでは thinking_level パラメータが追加され、タスクの複雑さに応じて推論の深さを調整できるようになりました。Google は本モデルを人間の知性の「力の増幅器」と位置づけ、科学者が概念的深さと創造的方向性に集中できる環境の実現を目指しています。
