OpenAI、24時間自律開発可能な新コーディングモデル GPT-5.1-Codex-Max を発表

投稿者:

OpenAI が、エージェント型コーディングモデルの最新版となる「GPT-5.1-Codex-Max」を発表しました。このモデルは、24 時間以上にわたる複雑な開発タスクを自律的に処理する能力を備えており、AI によるソフトウェア開発のあり方を大きく変える可能性を秘めています。

その中核をなすのが「コンパクション」と呼ばれる新技術です。従来の AI モデルは、扱える情報量(コンテキストウィンドウ)に上限があるため、長時間の作業では文脈を見失いがちでした。コンパクション技術は、コンテキストウィンドウが限界に近づくと、過去の対話履歴から重要な情報だけを自動で抽出し、残りを圧縮・削除します。これにより、モデルは常にタスクに必要な文脈を保持し続け、大規模なリファクタリングや長時間のデバッグといった複雑なワークフローを安定して実行できます。

性能面でも、GPT-5.1-Codex-Max は旧モデルを大きく上回ります。ソフトウェアエンジニアリングの課題解決能力を測る「SWE-bench Verified」評価では 77.9% という高い精度を達成し、一部のベンチマークでは Google の Gemini 3 Pro をも凌ぐ結果を示しています。また、トークン効率も改善されており、思考に使うトークン量を約 30% 削減しながら、同等以上の性能を維持しています。

このモデルは、OpenAI の製品として初めて Windows 環境での動作を公式にサポートし、より多くの開発者が利用できるようになりました。ChatGPT の有料プランユーザーはすでに追加料金なしで利用可能となっており、API 経由での提供も近日中に予定されています。セキュリティ面では、サンドボックス動作が標準とされ、安全な利用が促されています。

GPT-5.1-Codex-Max の登場は、開発者の役割を「コードを書く」作業から、「AI に要件を伝え、成果物をレビューする」作業へとシフトさせる流れを加速させるでしょう。OpenAI の社内データでは、すでにエンジニアの 95% が毎週 Codex を利用し、プルリクエストの提出量が 70% 増加したと報告されています。AI が実装の大部分を担うことで、開発者はより創造的で本質的な業務に集中できるようになるかもしれません。(802文字)