Anthropic、革新的な「Computer Use」機能を発表 – Claude 3.5の大幅アップグレードも

投稿者:

Anthropicは最近、AIがコンピューターを直接操作できる革新的な機能「Computer Use」のパブリックベータ版を発表しました。この機能により、AIは自律的にパソコン上でカーソルの移動やクリック、テキスト入力など、人間と同じような操作を行えるようになります。

OSWorldのベンチマークテストでは、スクリーンショットカテゴリで14.9%のスコアを達成し、次点の7.8%を大きく上回る結果を示しました。Asana、Canva、DoorDashなどの大手企業が既にこの機能のテストを始めており、不具合のチェック、定型作業の自動化などで業務効率の向上が期待されています。

同時に、Anthropicは「Claude 3.5 Sonnet」の大幅なアップグレード版「Claude 3.5 Sonnet New」と、新モデル「Claude 3.5 Haiku」を発表しました。これにより、特にコーディング能力が大幅に向上し、SWE-benchテストのスコアは33.4%から49%に向上しています。

ただ、「Computer Use」機能にはまだいくつかの制約が報告されています。スクロールやドラッグ、ズームなどの基本操作や高解像度画面での操作ではうまく動かないことがわかっており、実験段階ではエラーが頻発すると言われています。また、セキュリティ面では、不正使用を防ぐための特別な監視システムが開発され、承認されたドメインにのみインターネットアクセスを許可し、重要なデータへのアクセスを制限することなどが推奨されています。

この新機能は、AIがより人間に近い形でコンピューターを操作できる可能性を示した初めての事例となり、今後の技術革新に大きな影響を与えるとされています。医療分野での電子カルテ操作や、法務分野での契約書レビューなど、複数システムを使用して反復作業をする業務などへの応用が期待されています。