シンガポールに本社を置く AI スタートアップ Sapient Intelligence が、新モデル「 Hierarchical Reasoning Model ( HRM )」を発表しました。このモデルは、たった 2,700 万パラメータ( 0.027B )という超小型サイズながら、従来の大規模 AI を上回る推論能力を示しており、「 AI の巨大化競争」に一石を投じる存在として注目されています。
HRM の最大の特徴は、人間の脳の階層的な処理を模倣した独特なアーキテクチャにあります。高次の抽象的な計画を行うハイレベルモジュールと、詳細な計算を高速に行うローレベルモジュールを組み合わせることで、効率的な推論を実現しています。
注目すべきはその学習効率です。 HRM はわずか 1,000 例という少ないデータで学習が可能で、事前学習や Chain-of-Thought といった従来の手法も不要です。それにもかかわらず、高難度の推論課題である Sudoku Extreme や複雑な迷路問題、さらには ARC-AGI ベンチマークで高い成績を収めています。
特に注目すべきは ARC-AGI での成果です。このベンチマークは抽象的なパターン認識と推論能力を測るもので、従来の商用の大規模モデルが 21〜34% の達成率にとどまる中、 HRM は 40.3% という高いスコアを記録しました。これは GPT 系の大型モデルを含む従来の AI を明確に上回る結果です。
技術的な工夫も注目ポイントです。従来の AI では計算が複雑になるほど学習が不安定になりがちでしたが、 HRM では線形アテンションや適応的計算時間( ACT )という技術を組み合わせることで、この問題を解決しています。また、同じ推論モジュールを繰り返し使う再帰的なアーキテクチャを採用しており、問題が簡単なら少ない回数、複雑なら必要な回数だけ同じ処理を繰り返すことで、効率的でありながら深い思考も可能にしています。
この成果は、 AI 開発の方向性に大きな示唆を与えています。これまでの「パラメータ数を増やせば性能が向上する」というスケーリング法則を超えて、「仕組みとしての賢さ」で次世代 AGI (汎用人工知能)を目指すアプローチの可能性を示しているのです。
実用面でのメリットも大きく、小型であるため一般的な GPU でも動作し、エッジデバイスでの利用も容易です。データが少ない状況や高い推論精度が求められる分野、例えば希少疾患の診断や気候予測、ロボティクスなどへの応用が期待されています。
Sapient Intelligence は 2024 年設立の新しい企業で、シンガポールの本社に加えてサンフランシスコや北京にも研究拠点を持っています。機械学習・神経科学・数学の知見を組み合わせて、一般的な大規模言語モデルを超える次世代 AI の開発を進めています。
同社の CEO である Guan Wang 氏は「脳の階層処理を活用し、次世代 AI のブレークスルーを解き放つ」と強調しており、神経科学からの知見を AI に応用することで新たなブレークスルーを目指すと述べています。
HRM のソースコードは GitHub でオープンソース公開されており、論文も arXiv で閲覧できます。 AI コミュニティでは発表直後から「効率的な知能の未来」として高く評価されており、多くの研究者や開発者が注目しています。
ただし現在のバージョンは特定の推論タスクに特化しており、一般的な言語モデルとしての汎用性は限定的です。同社では HRM をベースに、自ら学習して成長していく AI の実現を目指しており、多階層推論や計画機能をさらに発展させていく予定です。