Amazon AGI Labs が新たに発表した「 Nova Act 」は、ウェブブラウザを自律的に制御してタスクを実行できる AI エージェントシステムです。2025 年 3 月 31 日に発表されたこのシステムは、現在「リサーチプレビュー」として主に開発者向けに公開されており、開発者向けの SDK が付属しています。
Nova Act の最大の特徴は、ウェブブラウザ内で人間が行うような操作を模倣し、複雑なタスクを自律的に実行できる点です。例えば、オンラインショッピングでの商品検索や購入、フォームの入力、予約の作成、カレンダーへの予定追加など、多岐にわたる操作が可能となっています。デモでは、アパート検索を行い、駅までの自転車での距離で結果を並べ替える様子が示されました。
提供される SDK を使うことで、開発者は複雑なワークフローを小さな命令に分解してエージェントを設計できます。さらに、Python コードを組み合わせることで、詳細なロジックや API 呼び出しを追加し、エージェントの機能を強化することも可能です。Amazon の内部テストによれば、Nova Act は「 ScreenSpot Web Text ベンチマーク」で 94% のスコアを記録し、OpenAI の CUA(88%)や Anthropic の Claude 3.7 Sonnet(90%)を上回る結果を示しています。
Nova Act は Amazon の AGI ラボ初の公開プロダクトであり、元 OpenAI 研究者である David Luan や Pieter Abbeel らが率いるチームによって開発されました。長期的な目標としては、結婚式の企画や企業の IT インフラ管理といった複雑な多段階タスクを自律的に処理できるエージェントの実現を掲げています。
また、近日公開予定の「 Alexa+ 」( Amazon の音声アシスタント Alexa の生成 AI を活用したアップグレード版)との連携も予定されており、ユーザーは音声指示でウェブ上のタスクを Nova Act に実行させることができるようになります。
現在、Nova Act SDK は「 nova.amazon.com 」を通じて米国在住の Amazon アカウントを持つユーザーに提供されています。開発者はここで API キーを取得し、実験やプロトタイプ開発を始めることができます。コスト面でも、競合他社より最大 75% の削減が可能とされており、実用性とコスト効率の両面で注目を集めています。