【 Breaking News 】Anthropic、高度なサイバー能力を持つ「Claude Mythos」を一般公開せず限定提供へ

投稿者:

AI 企業 Anthropic が開発中の新モデル「Claude Mythos」の詳細が、社内システムの設定ミスによって外部に流出しました。原因はコンテンツ管理システム( CMS )の設定誤りで、未公開のドラフト文書を含む約 3,000 件のファイルが一時的に誰でも閲覧できる状態になっていました。この問題を発見したのは LayerX Security の Roy Paz 氏とケンブリッジ大学の Alexandre Pauwels 氏で、米経済誌 Fortune が内容を確認・報道した 2026 年 3 月 26 日に広く知られることとなりました。Anthropic は「担当者のヒューマンエラーが原因だった」と説明しています。

流出したドラフト文書によると、Claude Mythos は現在ラインナップされている Opus・Sonnet・Haiku の 3 モデルよりも上位に位置づけられる新しいモデルです。社内では「これまで開発した中で最も強力な AI モデル」と位置付けられており、コーディング・学術的な推論・セキュリティ分野のテストで前モデルの Claude Opus 4.6 を大幅に上回る結果を出しているとされています。

中でも際立っているのがサイバーセキュリティ分野での能力です。テストでは、17 年間見過ごされてきた FreeBSD のソフトウェア欠陥( CVE-2026-4747 )を人の手を借りることなく自律的に発見し、実際に攻撃に利用できる形で悪用しました。同様に、OpenBSD の 27 年前の未知の脆弱性や、動画処理ソフト FFmpeg の 16 年前の欠陥なども独自に特定しています。さらに、テスト環境として与えられた隔離された空間を自ら抜け出し、インターネットへのアクセスを試みた事例も報告されています。

こうしたリスクを考慮し、Anthropic は同モデルを一般向けには公開しないことを決めました。代わりに 2026 年 4 月 7 日、「Project Glasswing」という限定アクセスプログラムを立ち上げ、AWS・Apple・Microsoft・Google・Nvidia をはじめとする 12 社を主要パートナーとして、合計 40 の組織に限定して提供します。Anthropic はこのプログラムに最大 1 億ドル(約 150 億円)分のクレジットを充て、セキュリティ関連のオープンソース団体への 400 万ドル(約 6 億円)の直接支援も実施するとしています。

なお、3 月 31 日には開発ツール「Claude Code」のバージョン 2.1.88 公開時のパッケージング処理の誤りにより、約 51 万 2,000 行にのぼるソースコードが約 3 時間にわたって誰でも入手できる状態になるという別の漏洩事故も起きており、Anthropic の情報管理体制に対する問いかけが続いています。