Anthropic Mythos の性能テスト：実験として Firefox と Windows の N-Day 脆弱性を攻撃

Anthropic’s Mythos Can Serve Up N-Day Exploits in Minutes or Hours

2026/06/09 SecurityBoulevard — Anthropic の Claude Mythos Preview の Zero-day 脆弱性を検出する能力と、それを悪用するエクスプロイトを迅速に開発する能力に対して、ここ数ヶ月におけるサイバー・セキュリティ分野の焦点が当て続けられてきた。ただし、同様の能力は、すでに公開され一部のシステムではパッチ適用済みである、N-day 脆弱性に対しても悪用できる。この状況は、Anthropic が “パッチ・ギャップ” と呼ぶ状態を生み、未更新のシステムを攻撃にさらす。

Anthropic の研究者は、「Zero-day は N-day より危険な場合がある。なぜなら、生成されたパッチ自体が、バグへのロードマップを提供するからだ。ソフトウェア・ベンダーがセキュリティ更新を公開すると、攻撃者はパッチ差分解析 (patch diff) を行い、修正前と修正後のソースコードやバイナリを比較して変更箇所を特定し、その脆弱性をリバース・エンジニアリングすることができる」と述べている。

それが意味するのは、実用的なエクスプロイトの流通が時間の問題であることだ。

このようなリバース・エンジニアリングは容易ではなく、従来の攻撃者たちは、パッチを分析してエクスプロイトを開発するまでに数週間から数か月を要していた。それに加えて、攻撃対象の特定／エクスプロイトの配信／検知の回避といった工程も必要であるが、なによりも難易度が高かったのは、リバース・エンジニアリングの専門知識が必要なエクスプロイト開発であった。

ボトルネックは消失

Anthropic の研究者は、「フロンティア・モデルにより、このボトルネックはほぼ解消された。現在の、すべての環境におけるパッチ・ギャップは、従来と比べて遥かに大きな脅威へと成長している。モデルの能力が向上するにつれて、さらにリスクは増大する。防御側はパッチ適用の速度を加速させる必要がある」と指摘している。

従来は数週間から数か月を要していた作業が、フロンティアモデルでは数分で完了する可能性がある。

2026年6月8日のレポートで Anthropic が公表したのは、Mozilla Firefox の 18 件の最新パッチを Mythos に入力し、自律的に 8 件のコード実行エクスプロイトを生成したことだ。

さらに Windows カーネルの 21 件のパッチに対しては、ソースコードが存在しない状況でも 8 件の完全なエクスプロイト・チェーンを生成し、低権限ユーザーから SYSTEM 権限への昇格を達成した。

対象として SpiderMonkey (Firefox の JavaScript エンジン) が選定された理由は、ブラウザ・エクスプロイト・チェーンにおいて最も脆弱な侵入ポイントであるためだった。

SpiderMonkey は、2026年2月の Firefox 148 および 3月の Firefox 149 に含まれており、今回のテストの対象となったのは、Mozilla のソースリポジトリで 90 日以上前に修正が公開されている脆弱性である。

ボリュームとスピード

研究者が実施したテストでは、Mythos と Opus 4.5〜4.8 などの 6 つの AI モデルが用いられ、修正済み脆弱性に対する PoC の生成能力が評価された。

Opus 系モデルでは、2 件から 11 件の PoC が生成されたのに対し、Mythos は 14 件の PoC を生成した。

Mythos では、最初の PoC は 12 分で生成され、残り 13 件も 40 分以内に生成された。最後の PoC まで含めると約 3 時間で 14 件を完了した。それに対して、Opus 4.8 が 11 件を見つけるまでに要した時間の約 2 倍である。

アプリケーション・クラッシュから、実用的なエクスプロイトへと変換する能力の検証では、Mythos は 1 時間未満で最初のエクスプロイトを生成し、約 12 時間で 8 件を作成した。その一方で、他モデルは合計 4 件に留まった。

研究者は、「これらの結果を評価すると、Mythos Preview は Mozilla がパッチを公開してから 1 時間以内に最初のエクスプロイトを生成できる。一方で、パッチ適用済み Firefox 148 がリリースするまでには 18 日が必要となっていた」と述べている。

数週間から数分へ

Windows でも、同様の結果が確認された。

研究者は、「今回のテストにおいて、モデルに与えた脆弱性の情報は、パッチ公開日に攻撃者が入手可能なものと同じである。つまり、脆弱なバイナリと修正済みバイナリ／公開デバッグシンボル／Ghidra による逆コンパイル結果／Ghidriff による関数レベル差分／Microsoft の公開アドバイザリである」と指摘している。

21 件の脆弱性に対し、各モデルを 3 回ずつ実行した結果として確認されたのは、ソースコードがない状態であっても、N-day 攻撃が加速される見通しである。

Mythos は、18 件の脆弱性に対して PoC を生成した。最初の PoC は 31 分で生成され、全 18 件は 6 時間以内に完成した。他モデルが達成したのは 13〜15 件であった。

さらに Mythos は、8 件の異なるエクスプロイト・チェーンを生成し、そのコストは API クレジットで約 $15,700 であり、1 件の権限昇格あたり平均で $2,000 であった。

研究者は、「N-day 攻撃の制約は、数千ドルのコストと API アクセスのみであるため、攻撃者の数は大幅に拡大するだろう。十分な時間があれば、多くの AI モデルを用いて N-day エクスプロイトの生成が可能になるが、その生成量と速度の点で Mythos は決定的な変化をもたらす」と述べている。

単一の攻撃者であっても、1 ヶ月分のパッチに対する実用的エクスプロイトを、半日で生成することが可能になり、特別な専門知識も不要となる。

N-day から N-hour へ

従来の月次でのリリースや、段階的な展開といったパッチ運用は、もはや成立しない。これまでのパッチ適用は、「エクスプロイト開発には専門家による数週間の作業が必要であり、その専門家も限られている」という前提に基づいていた。さらに、現在では、N-day という表現は実態を正確に表していない。現実は N-hour に近いと研究者は結論付けている。

訳者後書：AIモデルがもたらす、新たなリスクの原因について解説する記事です。この問題の背景にあるのは、ソフトウェアのパッチが公開される際に、最先端のAIモデルを使うことで修正前後の差分から、脆弱性の仕組みが簡単に解析されてしまうという現実です。この処理の自動化により、従来は専門知識を持つ人が数週間かけていたエクスプロイト開発のボトルネックが解消され、パッチ公開からわずか数時間で攻撃コードが生成されてしまうリスクが生まれています。それにより、N-day 脆弱性におけるリスクが高まると、この記事は指摘しています。よろしければ、Glasswing での検索結果も、ご参照ください。

M	T	W	T	F	S	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

ボトルネックは消失

ボリュームとスピード

数週間から数分へ

N-day から N-hour へ

Share this: