OpenAI は、自社の推論システムが 2025 年の国際情報オリンピック( IOI )のオンライン競技で金メダル相当のスコアを達成し、人間参加者の中で 6 位、 AI 参加者の中で 1 位となったと発表しました。
IOI は高校生(中等教育段階)を対象とする毎年開催の国際的な競技プログラミング大会で、各国からは最大 4人の代表を選抜し、2 日間・各 5 時間で合計 6 問のアルゴリズム問題に個人戦で挑みます。上位 1/12 が金メダル、次の 2/12 が銀、次の 3/12 が銅を受け取ります。
この結果は、昨年から劇的な性能向上を遂げたことを示しています。2024 年の IOI では、 OpenAI の専用モデル「 o1-ioi 」が本番で 213 点程度にとどまり、約 49 パーセンタイルと低調な結果でした。しかし今回は、汎用推論モデルの組み合わせで金レベルに到達し、順位換算で上位約 2% ( 6 位 / 330 人相当)へと飛躍的な向上を遂げました。
競技では、人間参加者と同じ制約条件のもとで実施されました。 5 時間の時間制限、各課題 50 回までの提出制限、インターネットや RAG (検索拡張生成)の使用禁止、基本的なターミナル環境のみという条件で、システムは複数の汎用推論モデルを組み合わせ、限られた試行回数と時間の制約の中で、コードを生成して自己検証を行い、最も良い解答を選択して提出するという手法を採用しました。
技術的な観点では、今回のシステムは IOI に特化して学習したものではなく、汎用の推論モデル群を組み合わせて候補プログラムを生成・実行し、自己評価で提出案を選ぶ「テスト時探索+自己検証」型の戦略が採られました。昨年と比べて補助的な処理は軽量化され、「どのサンプルを提出するかの選択」と「競技 API とのやり取り」に絞られています。
この成果は、数学分野での成功と並んで注目されています。先月 OpenAI と Google DeepMind がともに国際数学オリンピック( IMO ) 2025 で金メダル相当の結果を示し、自然言語のみでの解答で高得点に到達したことが話題となりましたが、推論系の性能進化が数学とプログラミング分野の両方で顕著になってきました。