Anthropic’s Mythos AI Reportedly Breaches NSA Systems in Red Team Exercise
2026/06/22 SecurityBoulevard — 今週、Anthropic の最先端 AI モデルである Mythos が、レッドチーム演習中に National Security Agency (NSA) の機密システムへ侵入したとの報道が浮上した。それにより、同モデルがもたらすセキュリティ上の脅威に対する懸念が高まり、同社と連邦政府の間での対立は、さらに混迷を深めている。

連邦政府は Anthropic に対して、同社の最新かつ最も強力な最先端 AI モデルである Mythos 5 と Fable 5 への、海外からのアクセスを遮断するよう命じている。しかし、それから 2 週間も経たないうちに報じられたのは、もはや Anthropic を国家安全保障上の脅威ではない可能性があると、トランプ大統領が Axios に対して語ったことだ。
Anthropic をセキュリティ上の懸念と見なしているかとの問いに対し、トランプ大統領は「まあ、今はそうではない。しかし、1 週間前ならそうだったかもしれない」と答えた。
先週の G7 Summit で大統領は、Anthropic CEO の Dario Amodei と会話を交わし、「Amodei は感じが良く賢い人物だった。今回の問題は、膨大な責任を伴うものであるが、彼は非常に迅速に対応してくれた。こうした問題を軽く扱う人は、即座に刑務所へ送られる可能性があるが、彼は非常に責任ある対応をしたと思う」と Axios に語った。
こうした一連の出来事の背景にあるのは、Anthropic や OpenAI などが開発する最先端 AI モデルが、ソフトウェア脆弱性を迅速に発見して悪用する能力である。サイバーセキュリティ上の懸念が高まっている状況の中で、この種の AI モデルの能力が証明され、民間企業との対立において強硬な姿勢を示す傾向がある現政権も、この新しいテクノロジーの影響を受けている。
発言が懸念を招く
先週に NSA システムについて報じた The Economist によると、NSA 長官兼 United States Cyber Command 司令官を務める米陸軍大将 Joshua Rudd に対して、上院情報委員会副委員長である Mark Warner 上院議員 (民主党) が、「Mythos は数週間ではなく数時間で、われわれの機密システムのほぼすべてに侵入した」と述べたという。
この発言は、6月11日に実施された NSA ネットワークに対する認可済みのレッドチーム・テスト後に行われたと報じられている。こうした最先端 AI モデルに対するリリース前テストを、より迅速に実施する必要性を訴えるために、Mark Warner は発言したとされている。
Mythos 5 と Fable 5 に対する懸念を、この発言が、さらに高めたようである。そのときのレッドチーム演習の結果が根拠の一部となり、2週間も経たないうちに米国防総省と米国商務省が Anthropic に対して、AI ベンダーに勤務する者を含めた、外国の機関や個人へのアクセス禁止を求めることになったという憶測を呼んでいる。
こうした経緯の中、連邦政府の指示を受けた Anthropic は、すべてのアクセスを遮断した。
Amazon の報告が指令を後押し
ホワイトハウスの指示を後押しすることになったのは、脆弱性に関して Amazon が政府へ提出した報告書であるとみられており、トランプ大統領も Axios とのインタビューでこの点を認めている。
トランプ大統領は、「Anthropic を通報したのは競合企業であり、同時に Anthropic の株主でもある企業だ。彼らは、Anthropic のやり方を快く思っておらず、強い懸念を抱いていた。しかし、ここまでの対応は、非常に責任あるものだったと思う」と述べている。
この指令が発出された翌日に公開したブログ記事で Dario Amodei は、「Anthropic は政府の法的指令に従い、すべてのユーザーに対して Fable 5 および Mythos 5 へのアクセス権を無効化している」と説明している。
その一方で同氏は、「限定的で潜在的な jailbreak が発見されたという理由だけで、数億人に提供されている商用モデルを回収すべきだという考えに、私は同意できない。この基準が業界全体へ適用されるなら、すべての最先端モデル提供企業による新モデルの展開が、事実上停止すると考えている」と主張した。
限定的で普遍的ではない jailbreak
Amazon が開示した限定的で普遍的ではない潜在的な jailbreak について Dario Amodei は、「本質的には、モデルに特定のコードベースを読み込ませ、存在するソフトウェア上の欠陥を修正するよう求めることに等しい。我々の理解では、潜在的な jailbreak の 1 つが政府へ共有されただけだ」と述べている。さらに同氏は、この jailbreak は OpenAI の GPT-5.5 などの他モデルにも適用される可能性があると指摘している。
その後に Anthropic の幹部たちは、ホワイトハウスと協力し、共通のリスク管理フレームワークの策定に着手した。しかし、政府による Anthropic のモデル利用のあり方を巡って、トランプ政権と Anthropic の間で高まっている見解の相違と緊張関係を、この取り組みだけで十分に緩和できるかという点は、依然として不透明である。
トランプ大統領は Axios に対して、Defense Production Act に基づく自身の権限に言及しながら、「私には多くの手段を行使する権限がある。しかし、それを実際に使う必要があるかどうかは分からない」と語った。
訳者後書:この出来事の背景には、レッドチーム演習における Mythos が、特定のコードベースを読み込ませてソフトウェア上の欠陥を修正するよう求める手法を介して、国家安全保障局 (NSA) の機密システムへ数時間で侵入したことがあるようです。この jailbreak は、他社の最先端モデルにも共通するものだと指摘されており、特定の製品に依存しない広範な課題を提示しています。AI モデルの入力制御や機能の悪用がもたらす潜在的なセキュリティリスクについて、システム設計の段階から、その挙動を深く意識する必要があるようです。よろしければ、Mythos での検索結果も、ご参照ください。
You must be logged in to post a comment.