Anthropic が最新の大規模言語モデル「 Claude 3.7 Sonnet 」をリリースしました。このモデルは業界初の「ハイブリッド推論」 AI として注目を集めており、「即時応答」と「深い思考プロセス」を 1 つのシステムで実現する革新的なアプローチを採用しています。
Claude 3.7 Sonnet の最大の特徴は、ユーザーが与えるタスクに応じて 2 つの思考モードを自動的に切り替えられる点です。簡単な質問や日常的なタスクには迅速に回答する「標準モード」で回答し、より複雑な問題に対しては、ステップごとの推論プロセスを展開する「拡張モード」が採用されます。これは人間の脳が瞬時の反応と深い熟考を単一システムで処理するのと同様の柔軟性を目指したものです。
Anthropic によれば、このモデルは前バージョンと比較して数学、物理学、コーディング、指示に的確に追従する能力などの分野で大幅に性能が向上しています。特に注目すべきは、競合他社が数学やコンピュータサイエンスの競技問題に焦点を当てる中、Claude 3.7 Sonnet はビジネスや日常生活での実践的な課題解決に重点を置いている点です。
開発者向けには、モデルが思考に費やす時間やトークン数を細かく調整できる API も提供されており、スピードと回答の質のバランスをニーズに合わせて最適化できます。複数の業界標準ベンチマークでも優れた結果を示しており、特に実際のソフトウェア問題解決を評価する SWE-bench でトップクラスの性能を発揮しています。
また、同時に発表された「 Claude Code 」は、開発者向けのエージェント型コーディングツールです。このツールはターミナルから直接利用でき、コードの生成やデバッグ、タスクの自動化をサポートします。一部の企業では既にテストが行われており、エラーの少ない本番環境向けコードの生成に成功したと報告されています。
価格設定は従来モデルと同じで、入力トークン 100 万あたり 3 ドル、出力トークン 100 万あたり 15 ドルと、競合の OpenAI 「 o1 」(入力 15 ドル / 出力 60 ドル)と比較してコストパフォーマンスが良い点も特徴です。
Claude 3.7 Sonnet は無料プランから利用可能ですが、拡張モードは有料プランのユーザーに限定されています。また、Amazon Bedrock や Google Cloud の Vertex AI 経由でもアクセス可能です。
筆者の視点:兼ねてから予告されていた、「ハイブリッド型」のモデルがリリースされました。ユーザーはどのモデルを選択するかを考える必要なく、単純に質問をすればモデル側が自動的に振り分けて回答を生成してくれます。今後 OpenAI もこの方向のリリースをすると予告しており、「ハイブリッド型」は 2025 年前半期のトレンドになりそうです。
また競合他社が新しいモデルを次々と発表していく中、表面上は沈黙を守っていた Anthropic がついに新しいモデルを発表したということにも注目が集まっています。ただ、筆者も日常的に Claude を使用していますが、大っぴらに新しいモデルとしてリリースはありませんでしたが、使っていてわかるくらい細かいアップデートは適用されていました。この辺は会社としての方針というか、わずかな進化を大げさに宣伝しない Anthropic の会社としての「良心」と好意的に捉えたいと思っています。