DeepSeek-Math-V2、数学オリンピック金メダル水準を達成した初のオープンソース AI

投稿者:

2024 年 11 月 27 日、中国の DeepSeek AI チームが数学的推論に特化した AI モデル「DeepSeek-Math-V2」を発表しました。6850 億パラメータ( 685B )の Mixture-of-Experts(MoE)アーキテクチャを採用し、国際数学オリンピック(IMO)で金メダル水準を達成した世界初のオープンソースの数学推論に特化した大規模言語モデルとなります。

同モデルは IMO 2025 において 6 問中 5 問を正解し、83.3% の正答率で 252 点満点中 210 点を獲得。これは金メダルに相当する成績で、世界 3 位に位置します。また 2024 年の Putnam 数学競技では 120 点満点中 118 点を記録し、人間の歴史上最高スコア 90 点を大幅に上回りました。

技術的な革新として「生成と検証」のループメカニズムを導入。専用の検証器が証明過程を逐次的に論理チェックし、欠陥を検出すると即座にフィードバックを提供して自己修正を行います。DeepSeek-V3.2-Exp-Base を基盤とし、Multi-head Latent Attention(MLA)により最大 128K トークンの長文コンテキスト推論をサポートします。

Apache 2.0 ライセンスの下でモデルウェイトが公開され、研究・商用利用が可能です。Hugging Face と GitHub で利用でき、マルチGPU推論に必要なのは、80GB の GPUメモリのみです。これまで Google DeepMind や OpenAI など閉鎖的な研究所のみが解決できるとされた自動定理証明分野において、オープンソースでの突破口を開いたことで業界に大きな影響を与えています。