【 Breaking News 】ARC-AGI-3 リリース：最先端 AI のスコアは人間の 1% 未満

2026 年 3 月 25 日、AI の能力評価を手がける非営利団体 ARC Prize Foundation が、新しい AI テスト「 ARC-AGI-3 」を公開しました。発表イベントはサンフランシスコの Y Combinator 本部でライブ配信され、テストの考案者である François Chollet 氏と OpenAI CEO の Sam Altman 氏が、「 AI の知性をどう測るか」をテーマに議論を交わしました。

このテストが従来と大きく異なるのは、ゲームのルールも目標も AI に一切伝えない点です。 150 種類以上のゲームと 1,000 以上のステージが用意されており、 AI はルールを自分で読み解きながら攻略を進めなければなりません。一般の人であれば平均 7.4 分でクリアできる難易度に設定されており、「誰でも解けるが、説明書はない」という条件が AI には大きな壁となっています。

採点方法も独特です。正解できたかどうかだけでなく、人間と比べてどれだけ効率よく解けたかが問われます。「（人間の手数 ÷ AI の手数）の 2 乗」という計算式を使うため、やみくもに試行を繰り返して正解にたどり着いても評価は上がりません。理解せずに解いても意味がない、という設計です。

結果は、現在の AI 技術の限界をはっきりと示すものでした。最高スコアを記録したのは Google Gemini Pro のわずか 0.37% 。 GPT 5.4 High が 0.26% 、 Opus 4.6 が 0.25% と続き、 xAI の Grok 4.20 は 0% でした。事前の開発者向けテスト期間では Tufa Labs の StochasticGoose が 12.58% を記録しましたが、これも人間の水準には程遠い数字です。

この結果が注目を集めたのは、発表のタイミングも関係しています。 NVIDIA CEO の Jensen Huang 氏が「 AGI はすでに実現した」と発言したわずか数日後の公表だったからです。 ARC Prize Foundation は「モデルの規模を拡大するだけでは、未知の状況に柔軟に対応できる AI は生まれない」との立場を取っており、今回のスコアはその主張を裏付ける形になりました。

ARC Prize 2026 では、総額 200 万ドル（約 3 億円）の賞金をかけたコンテストが実施されます。提出期限は 2026 年 11 月 2 日、結果発表は 12 月 4 日の予定で、参加者は開発したソリューションをオープンソースとして公開することが求められます。