Google DeepMind、高度な推論能力を持つ新AIモデル「Gemini 2.0 Flash Thinking」を発表

投稿者:

Google DeepMind が発表した「 Gemini 2.0 Flash Thinking 」は、AI の推論能力を大幅に向上させた画期的な実験モデルです。このモデルは、数学や科学的推論、マルチモーダル理解において優れた性能を発揮し、AIME (数学)で 73.3% 、GPQA Diamond (科学)で 74.2% という高いスコアを達成しています。

Gemini 2.0 Flash Thinking の大きな特徴は、AI の思考過程を段階的に表示する機能を備えていることです。これにより、ユーザーは問題解決のステップを確認することができます。また、 100 万トークンのコンテキストウィンドウを持ち、大量のテキストや複雑なデータセットを処理できるほか、ネイティブコード実行サポートやマルチモーダル対応も可能となっています。

現在、Google AI Studio と Gemini API を通じて無料で試験利用ができ、開発者向けに API も提供されています。Gemini 2.0 Flash Thinking は、OpenAI の GPT-4o や Anthropic の Claude 3.5 Sonnet など、他の強力な AI モデルを性能面で上回っているとされ、Google CEO のスンダー・ピチャイ氏は、このモデルを「 Google 史上、最も思慮深いモデル」と評価しています。


筆者の視点:Geminiの各モデルはユーザーが評価するChatbot Arenaのリーダーボードで好成績を収めています。今回発表されたモデルも一位を獲得しました。Googleが静かにAIリーダーとしての存在感を示しています。

Screenshot by HuggingFace LLM Leaderboard