OpenAI が 2025 年 7 月 17 日、「 ChatGPT Agent 」を発表しました。これは AI が自身の仮想コンピュータを操作して複雑な作業やエージェント的なタスクを実行できる新機能で、従来のチャットボットの枠を大きく超えた進歩です。
ChatGPT Agent の最大の特徴は、専用の仮想環境でウェブブラウザ、ターミナル、 API を利用してタスクを実行できることです。ウェブサイトの操作、コードの実行、データ分析、プレゼンテーションやスプレッドシートの作成など、これまで人間が手作業で行っていた複雑な業務を一貫して代行します。
具体的な使い方として、「 Gmail と連携して今日のメールを要約」「競合 3 社を分析してスライド資料を作成」といった一連の指示で、複数の作業を自動実施できます。作業の進捗や内容は画面上でナレーション表示され、ユーザーがいつでも介入・中断・修正できる仕組みになっています。
性能面では、様々な AI 評価ベンチマークで従来モデルを大幅に上回る成果を達成しています。特に注目すべき結果として、専門家レベルの質問で構成される「 Humanity’s Last Exam 」では 44.4% を記録し、従来モデルを大きく上回りました。スプレッドシート操作では 45.5% の精度を記録し、 Microsoft の Copilot ( 20% )を 2 倍以上上回っています。
従来の Operator (ウェブサイト操作)と Deep Research (情報収集・分析)の機能を統合し、 ChatGPT の会話能力と組み合わせることで、計画、調査、実行を一貫して行えます。カレンダーの確認、ディナーの予約、競合分析レポートの作成など、個人利用からビジネス用途まで幅広く対応します。
安全性についても十分な配慮がなされています。メール送信や購入などの重要なアクションを行う前には必ずユーザーの許可を求め、悪意のあるウェブサイトや隠し指示による不正操作を防ぐ仕組みも導入されています。ユーザーはワンクリックですべてのブラウジングデータを削除でき、セッション情報やパスワードはモデルに保存されません。
利用方法は、 ChatGPT Plus/Pro/Team ユーザーがツールドロップダウンから「 agent mode 」を選ぶか、チャットで「 /agent 」と入力するだけです。 Pro ユーザーは月 400 メッセージまで、 Plus および Team ユーザーは月 40 メッセージまで利用可能です。現在のところ欧州経済領域とスイスは対象外ですが、今後順次拡大予定です。
このリリースは、 AI エージェント市場( 2025 年に 42.6 億ドル、 2032 年までに 1,408 億ドル(約 20 兆 8,384 億円)に成長予測)での OpenAI の戦略的進出を示しています。競合として Anthropic の Claude や Google の Project Mariner 、 Microsoft の Copilot Studio などがありますが、 ChatGPT Agent は統合されたツールセットとベンチマーク性能で優位性を示しています。
ただし、初期段階では一部機能がベータ版であり、複雑な新規タスクではトレーニングデータの範囲外で失敗する可能性もあります。それでも、 AI が単なる応答生成から「デジタル従業員」としての自律的なタスク実行へと移行する転換点を示す重要なリリースといえるでしょう。