AI の能力による脆弱性発見プロセスの変化:攻撃者の参入障壁が大幅に低下

Commercial AI Models Show Rapid Gains in Vulnerability Research

2026/04/17 infoSecurity — 非公開の最先端 AI モデルである Anthropic Claude Mythos が、主要なオペレーティング・システムをカバーするかたちで数千件のゼロデイ脆弱性を特定できる能力を示す一方で、一般的な商用モデルにおいてもソフトウェアのバグ発見能力が進展している。Forescout の Verde Labs によると、1 年前には AI モデルの 55% が基本的な脆弱性調査に失敗し、93% がエクスプロイト開発タスクに失敗していた。しかし、その後の進展により、2026年のテスト対象となった全モデルが脆弱性調査タスクを完了し、その半数において、自律的に動作するエクスプロイト生成が可能となっている。

この調査の一環としてテストされた 50 の AI モデルは、商用/オープンソース/アンダーグラウンドで提供されているものである。Forescout がテストした中で、最も高性能なモデルである Claude Opus 4.6/Kimi K2.5 は、複雑なプロンプトを必要とせずに脆弱性の発見/悪用が可能であり、経験の浅い攻撃者でも利用可能な状態となっている。

Forescout の VP of Security Intelligence である Rik Ferguson は、「これらは人間の能力を超える広く入手可能な AI モデルである」と述べている。ただし、彼は、これらが Mythos の規模/速度/品質には達していない可能性も認めている。

テストにおいて Forescout は、単一プロンプト/RAPTOR エージェント型フレームワーク/同社独自のエクステンションを用いることで、広く導入されている OpenNDS において 4 件の新規ゼロデイ脆弱性を発見したと説明している。

RAPTOR は、サイバーセキュリティーの研究/攻撃/防御を目的として設計されたオープンソースのエージェント型 AI フレームワークである。また、発見された脆弱性のうちの 1 件は、すでに Verde Labs が解析していたコード内に存在していたものであり、手動では特定されなかったものだと説明されている。

AI が未知の脆弱性発見のハードルを低下させる

Forescout のテストでは、商用モデルが高い性能を示したが、コストという課題もある。たとえば、Claude Opus 4.6 では出力 100 万トークンあたり最大 $25 のコストが発生する。その一方で、DeepSeek 3.2 のようなオープンソース・モデルは低コストで基本的なタスクの処理が可能であり、すべてのテスト・タスクのコストは $0.70 未満である。

それとは対照的に、Claude Mythos は入力/出力のコストが、それぞれ 100 万トークンあたり $25/$125 に設定される予定である。タスクの複雑性とコストに応じて異なるモデルを使い分けることが、防御側/攻撃者の双方にとって、実用的な戦略となり始めている。

Forescout が指摘するのは、オープンモデルでも新たな脆弱性の発見が可能であり、Project Glasswing のような大規模イニシアチブにより重要ソフトウェアにおいて、数千のゼロデイが発見され得るという現実である。それを踏まえて、ユーザー組織は自らの環境に未知の脆弱性が存在し、それらが AI により発見されることを前提とすべきだ。