OpenAI が 2025 年 4 月 16 日に発表した最新 AI モデル「o3」と「o4-mini」は、高度な推論(reasoning)能力を持つ AI モデルとして注目を集めています。o3 は複雑な分析やマルチモーダル(テキスト+画像)タスクに強みを持ち、o4-mini は o3 の小型・高速・低コスト版で特にコスト効率や応答速度を重視する用途向けに設計されています。
両モデルの最大の特徴は「think with images(画像で考える)」能力です。ユーザーがアップロードしたホワイトボード、手書きスケッチ、図表などの画像を理解し、推論プロセスに組み込むことができます。画像を回転・拡大・トリミングするなどの処理を自動で行い、画像が不鮮明でも内容を把握できる点も優れています。例えば、経済学の問題セットの写真をアップロードすると手順を分かりやすく解説したり、エラー画面のスクリーンショットから原因分析を行ったりすることができます。
さらに注目すべき点として、o3 と o4-mini は ChatGPT 内の全ツール(ウェブ検索、Python 実行、画像生成・解析など)を自律的に組み合わせて使うことができます。これにより、複雑なマルチステップ課題(例:カリフォルニア州の将来のエネルギー消費予測 → データ検索 → Python で予測 → グラフ生成 → 要因解説)を一度の指示で自動的に処理できるようになりました。モデル自身が「どのツールを、いつ、どう使うか」を判断する能力(エージェンティック性)が大幅に強化されています。
同時に、OpenAI はオープンソースのコーディングエージェント「Codex CLI」も公開しました。これによりユーザーの PC 上でターミナルから直接 AI モデル(o3・o4-mini など)と連携し、コーディングやタスク自動化が可能になります。
o3 は数学、プログラミング、科学、画像認識などで最先端の性能を発揮し、従来モデルより自然な会話・応答が可能です。エージェント的な AI(自律的にタスクを実行する AI)への進化が加速しており、「AGI(汎用人工知能)」の実現に一歩近づいたとの評価もあります。
ChatGPT Plus、Pro、Team ユーザーは既に o3・o4-mini を利用可能で、API 経由でも開発者が利用できます。さらに高性能な o3-pro も数週間以内に提供予定とされています。