Nous Research、数学コンテストで高得点を記録したAIモデル「Nomos 1」をオープンソースで公開

投稿者:

米ニューヨークの Nous Research は、300億パラメータ規模の新たな推論システム「Nomos 1」をオープンソースとして公開しました。本モデルは、権威ある大学数学競技会である 2025年ウィリアム・ローウェル・パトナム数学コンテスト(Putnam Contest)において、満点120点中87点という高得点を記録し、AIの数学的推論能力が大きく進歩していることを示しました。

Nomos 1 は、Nous Research が Hillclimb AI と共同で開発した、自然言語による数学問題の解決に特化した推論システムです。あわせて公開された「推論ハーネス」と呼ばれるオーケストレーションコードを用いることで、一般的な Mac でも約30億のアクティブパラメータで推論を実行でき、研究者や開発者が比較的容易に利用できる環境が整えられています。

87点というスコアは、2024年大会に出場した約4,000人の人間の参加者の中で、実質的に2位に相当する水準です。パトナム・コンテストは、米国とカナダで最も権威ある大学レベルの数学競技会として知られ、年によっては最高得点が90点、中央値がわずか2点ということもあるほど、極めて難易度が高い試験です。そうした試験でAIが人間のトップ層に匹敵する成績を収めたことは、その推論能力の飛躍的な向上を明確に示しています。

この成果を支えているのが、独自の二段階推論アプローチです。まず「解決フェーズ」では、複数のAI「ワーカー」が並行して問題に取り組み、自己評価や相互批評を繰り返しながら解答候補を生成します。続く「最終化フェーズ」では、それらの解答をグループ化し、トーナメント形式で比較することで、最も妥当な解答を一つに絞り込みます。この仕組みにより、複雑な問題に対して多角的かつ批判的な検討が可能になります。

Nomos 1 の優位性は、ベースモデルとの比較からも明らかです。同一の推論ハーネスと設定で Qwen3 を実行した場合、スコアは 120点中24点にとどまりました。この大きな差は、Nomos 1 の性能向上が単なる推論手法の最適化ではなく、モデルそのもののトレーニングによる成果であることを示唆しています。

Nomos 1 と推論ハーネスのオープンソース化は、AIを数学研究の「道具」から「共同研究者」へと位置づける流れを加速させるものです。かつては単純な計算さえ苦手だったAIが、世界最高難度とされる数学試験で成果を挙げたことは、未解決問題の解明や新たな科学的発見へとつながる可能性を強く感じさせます。