Anthropic’s Restricted Claude Mythos Moves Toward Public Release via Claude Code and Security
2026/05/26 CyberSecurityNews — Anthropic は、これまで厳格に制限してきた、同社の最強 AI モデル “Claude Mythos” に対する制限を緩和しつつあるようだ。新たな動きから示唆されるのは、“Mythos 1” (claude-mythos-1-preview) という名称での商用版が展開される可能性である。このモデルでは、Claude Code への直接統合に加え、刷新された Claude Security ダッシュボードへの組み込みも進められており、主にエンタープライズ顧客へ向けて提供される見通しである。

2026年3月下旬に Anthropic のコンテンツ・マネージメント・システムから、約 3,000 件の未公開内部資産が漏洩したことで、Claude Mythos の存在が明らかになった。その漏洩資料には、「これまでに開発した中で圧倒的に強力な AI モデル」と説明するブログ記事の草案も含まれていた。
その数日後に Anthropic はモデルの存在を正式に認め、特にサイバーセキュリティ/コーディング/学術的推論の分野において “飛躍的な進化” をもたらすモデルであると説明した。ただし、一般公開は行われず、Anthropic は 2026年4月7日に “Project Glasswing” を開始した。
このプロジェクトは、防御型サイバーセキュリティ用途に限定されたプログラムであり、AWS/Apple/Google/Microsoft/NVIDIA/CrowdStrike/JPMorgan Chase を含む 40 以上の組織に対して、Mythos Preview が限定的に提供されるに至った。このモデルは、重要インフラのスキャンに投入され、広く利用されるオープンソース・ソフトウェアに潜んでいた、1 万件以上の High/Critical な脆弱性を、数週間のうちに特定した。
Mythos 1:段階的な商用リリースの兆候
現在、その方針は変化しつつある。”Project Glasswing” の最新レポートによると、対象範囲はオープンソース・プロジェクトにも拡大されており、適切なセーフガードが整えば、Mythos クラスのモデルは一般公開され得ると記載されている。これは、従来の無期限の制限という姿勢からの明確な転換である。
さらに、最近になって claude-mythos-1-preview を参照するソース・コード文字列が確認されており、”Claude Code および Claude Security における Claude Mythos モデルへのアクセス” という新たな説明文も併記されている。Testingcatalogue は、Claude UI 上に表示された Mythos 1 モデル・ラベルのスクリーンショットを共有していた。その後に、この表示は削除されたが、単なる仮説段階ではなく、実装準備段階にあることを示唆している。
これにより、明らかになったのは、以下の 2 製品への Mythos 1 の統合であり、構成は以下の通りとなる。
- Claude Code:Anthropic のエージェント型開発環境
- Claude Security: 脆弱性スキャンおよびパッチ提案機能を備えたプロダクト
2026年2月に公開された Claude Security は、Claude Opus 4.7 をベースとした限定リサーチ・プレビューであり、コードベースのスキャンと、人間によるレビュー向けのパッチ提案機能を提供してきた。現在のベータ版は、Claude Enterprise 顧客限定で利用可能となっており、Team および Max のサブスクライバーへの提供も予定されている。
現在は、検出済みの脆弱性に加えて、7日間および 30日間の履歴チャートや詳細なトリアージ結果を表示する、新しいダッシュボード・インターフェイスの開発も進められている。さらに Claude のナビゲーションバーには、Claude Code や Claude Design と並んで、独立した “Security” タブが確認されており、従来のエンタープライズ営業中心の提供形態から、一般ユーザー向けダッシュボードへ移行する流れが進んでいるように見える。
このアーキテクチャは、定期的なバックグラウンド自動スキャン/オンデマンド手動スキャン/レビュー後にマージ可能なパッチ提案付き Pull Request をサポートしている。2026年5月22日に更新された、Anthropic の協調的脆弱性開示ダッシュボードによると、281 件のオープンソース・プロジェクトに対して、1,596 件の脆弱性が公表されており、そのうちの 97 件が修正済みとなっている。
また、一部パートナー向けの内部評価では “Claude Opus 4.8” が検討されているとの情報もあり、2026年4月16日にリリースされた Opus 4.7 に続く開発サイクルとも一致している。また、Anthropic は Opus 4.7 において、攻撃的用途を自動的に検知/遮断するサイバーセキュリティ・セーフガードを導入しており、Mythos クラス・モデルの大規模展開に向けた前段階と位置付けられている。
現時点で浮かび上がっているのは、Mythos 1 をエンタープライズ製品内の限定機能として提供するという、慎重かつ段階的な商用化の戦略である。その後に、このモデルの極めて強力かつ潜在的に危険なサイバー能力に対して、安全性評価とインフラ保護体制が整った段階で、段階的な拡張を進める構想とされる。
訳者後書:この記事で紹介した強力な AI モデルの存在は、Anthropic のコンテンツ・マネージメント・システムから未公開の内部資産が漏洩してしまったことが原因で明らかになりました。このシステム管理における情報漏洩がきっかけとなり、本来は非公開だった最先端モデルの詳細やブログ記事の草案が外部に出てしまいました。その後、Project Glasswing を介して、Mythos Preview として大手ベンダーに限定的に提供され、重要インフラのスキャンに潜んでいた、1 万件以上の High/Critical な脆弱性を特定するという、目覚ましい成果を上げています。よろしければ、Mythos での検索結果も、ご参照ください。

You must be logged in to post a comment.