英国政府主催の AI ハッカソン：エージェントによるコード分析で 407 件の脆弱性を特定

UK Government Finds 400+ Vulnerabilities in AI Hackathons

2026/06/15 InfoSecurity — 英国政府が明らかにしたのは、フロンティア AI モデルを活用した一連の内部ハッカソンの結果として、数百件の脆弱性を発見／修正したことである。この毎週開催された対面形式のイベントは、Government Cyber Coordination Centre (GC3) による取り組みであり、National Cyber Security Centre (NCSC) と Department for Science, Innovation and Technology (DSIT) の共同イニシアチブとして実施された。その目的は、AI モデルを用いることで、9 つの政府省庁にまたがる公開コード・リポジトリをスキャンすることにあったとされる。

GC3 は、「単一のアプローチを強制するのではなく、各チームにモデルへのアクセスを提供し、独自のツールを構築してもらった。さらに毎週、何が機能したのかを確認しながら、最良のアプローチを積み上げていった」と説明している。

この取り組みにおいて、認証バイパス／データ漏洩／リモート・コード実行といった深刻な脆弱性を含む 407 件の問題が、参加者により特定された。

2026年6月12日に公表されたレポートによると、一部の脆弱性は既知の問題であり、補完的な対策により緩和されていたが、それ以外はゼロデイ脆弱性であったという。悪用が可能と評価された Critical および High リスクの脆弱性は、すべてが修正済みであり、実際に悪用された証拠は確認されていない。

このレポートは、「従来のスキャナでは不可能だった、サービス境界をまたぐ脆弱性の追跡が、AI モデルにより実現され、ビジネス・ロジックと技術的な詳細が結び付けられた。各省庁は、既存のフレームワークを通じて、検証と是正のための優先順位付けを行った」と指摘している。

それぞれのチームは、異なるアプローチを採用した。あるチームは、選定されたすべてのオープンソース・リポジトリ／オペレーターに適用できる、再利用が可能で範囲が限定され、一貫性のあるアプローチを構築した。そのために開発されたのは、5 つの新たなドメイン特化型 Claude Skills である。

別のチームは、Gitleaks／Trivy／Semgrep／Hadolint といった従来型のスキャン・ツールを利用して初期の発見事項を生成し、その後に、それらの発見事項にモデルを適用した。具体的には、OWASP／CWE フレームワークとの照合を行い、さらに個別の発見事項から攻撃経路を特定し、トリアージ段階における実行の可能性を検証した。

さらに別のグループは、パイプラインの各段階において、前段階の結果を読み取ることで検証を実施する、6 段階のエージェント型パイプラインを構築した。

強力な性能を発揮したフロンティア・モデル

このハッカソン・イニシアチブを通じて、複数の重要な教訓が得られたと、GC3 は述べている。

最も優れた成果は、構造化されたパイプライン内の厳密に範囲設定されたコンポーネントとして、フロンティア・モデルを利用したときに得られたものであった。従来の脆弱性管理ワークフローが、個別のタスクに特化したハーネスへと分解された。

適切なアーキテクチャとタスクの設計があれば、フロンティア・モデルは同様に、多くのニア・フロンティア・モデルおよびコード・スキャンで高い効果を発揮する。その一方で、問題を分解して広範なコンテキストを把握するためには、依然として人間の専門知識が不可欠であり、それが成果を左右する要素になった。

エージェントの速度は、人間が検証できる速度を上回る。したがって、発見され候補となる事項を生成するためのトリアージが不可欠であり、事前の慎重なスコープ設定と構造化された内部フィルタリングにより、焦点を明確化することでコストの削減にもつながる。このプロジェクト全体で、政府が負担したトークン費用は、わずか £13,000 ($17,467) であった。

次の大きな課題は、人間中心のプロセスを圧迫することなく、優先順位付け／レビュー／パッチ生成を統合することである。

しかし、Anthropic の Mythos／Fable モデルに対して、米国政府が導入した新たな禁輸措置が、このハッカソン・イニシアチブに与える影響は不明である。6月12日 (金) の深夜に発令された措置により、Anthropic が提供する最高性能モデルへのアクセスが、米国民以外のユーザーに対して遮断されることになった。

訳者後書：英国政府の取り組みは、公開コードのリポジトリに潜む認証バイパス／データ漏洩／リモート・コード実行といった、多数の深刻な脆弱性が発見されました。従来のスキャンツールでは見落とされがちだった、サービス境界をまたぐ複雑なビジネスロジックや、技術的な詳細が絡み合う部分に存在する問題が明らかにされました。また、今回のハッカソンでは、フロンティア AI モデルを構造化されたパイプラインに組み込むことで、従来のツールでは追跡が難しかった経路を特定できたとのことです。こうした取り組みと、その成果が公表されることで、セキリティ分野における今後の方向性が定まっていくのでしょう。

M	T	W	T	F	S	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28
29	30

強力な性能を発揮したフロンティア・モデル

Share this: