Anthropic、新モデル「Claude Opus 4.5」を発表ー コーディング性能で競合をリード

投稿者:

Anthropic は 2025年11月24日(米国時間)、新たなフラッグシップモデル「Claude Opus 4.5」をリリースしました。このモデルは OpenAI の「GPT-5.1-Codex-Max」や Google の「Gemini 3」といった競合とトップ性能を競うと位置づけられており、特にコーディングとエージェント関連の能力で高い性能を示しています。

Claude Opus 4.5 の最も顕著な特徴は、コーディング能力の向上です。ソフトウェアエンジニアリングタスクのベンチマーク「SWE-bench Verified」で 80.9% というスコアを記録し、競合モデルを上回ったと Anthropic は発表しています。また、多言語コーディングのベンチマークでも 8 言語中 7 言語で他のフロンティアモデルを凌駕しており、幅広い開発環境での活用が期待されます。

エージェント能力も強化されており、複数ステップの実行やツール利用を要する複雑なタスクでの性能が向上しました。PC 操作能力を測る「OSWorld」ベンチマークで 66.3% を達成するなど、AI が自律的にタスクをこなす「コラボレーター」としての役割を担う可能性を示唆しています。

競合モデルとの比較では、Opus 4.5 はコーディングで優位に立つ一方、例えば Google の「Gemini 3 Pro」は数学的推論で高い性能を維持しており、それぞれのモデルに強みが存在します。このため、実装やデバッグには Opus 4.5、アーキテクチャ設計や研究には Gemini 3 Pro といったように、用途に応じた「二刀流」の使い分けが有効な戦略となりそうです。

アクセシビリティの面では、API 利用料金が大幅に引き下げられた点が注目されます。100 万入力トークンあたり 5 ドル(約 790 円)、100 万出力トークンあたり 25 ドル(約 3,950 円)と、従来の Opus モデルの約 3 分の 1 の価格設定となり、高性能モデルの利用ハードルが大きく下がりました。このモデルは Anthropic の公式アプリや API に加え、主要なクラウドプラットフォーム、GitHub Copilot の有料プランでも利用可能です。

さらに、開発者が応答の質と速度のバランスを調整できる「エフォートパラメーター」や、画面の特定領域を詳細に分析する「zoom tool」といった新機能も追加されています。安全性も強化され、悪意ある指示(プロンプトインジェクション)への耐性が向上するなど、堅牢な運用が意識されています。