英国政府主催の AI ハッカソン:エージェントによるコード分析で 407 件の脆弱性を特定

UK Government Finds 400+ Vulnerabilities in AI Hackathons

2026/06/15 InfoSecurity — 英国政府が明らかにしたのは、フロンティア AI モデルを活用した一連の内部ハッカソンの結果として、数百件の脆弱性を発見/修正したことである。この毎週開催された対面形式のイベントは、Government Cyber Coordination Centre (GC3) による取り組みであり、National Cyber Security Centre (NCSC) と Department for Science, Innovation and Technology (DSIT) の共同イニシアチブとして実施された。その目的は、AI モデルを用いることで、9 つの政府省庁にまたがる公開コード・リポジトリをスキャンすることにあったとされる。

GC3 は、「単一のアプローチを強制するのではなく、各チームにモデルへのアクセスを提供し、独自のツールを構築してもらった。さらに毎週、何が機能したのかを確認しながら、最良のアプローチを積み上げていった」と説明している。

この取り組みにおいて、認証バイパス/データ漏洩/リモート・コード実行といった深刻な脆弱性を含む 407 件の問題が、参加者により特定された。

2026年6月12日に公表されたレポートによると、一部の脆弱性は既知の問題であり、補完的な対策により緩和されていたが、それ以外はゼロデイ脆弱性であったという。悪用が可能と評価された Critical および High リスクの脆弱性は、すべてが修正済みであり、実際に悪用された証拠は確認されていない。

このレポートは、「従来のスキャナでは不可能だった、サービス境界をまたぐ脆弱性の追跡が、AI モデルにより実現され、ビジネス・ロジックと技術的な詳細が結び付けられた。各省庁は、既存のフレームワークを通じて、検証と是正のための優先順位付けを行った」と指摘している。

それぞれのチームは、異なるアプローチを採用した。あるチームは、選定されたすべてのオープンソース・リポジトリ/オペレーターに適用できる、再利用が可能で範囲が限定され、一貫性のあるアプローチを構築した。そのために開発されたのは、5 つの新たなドメイン特化型 Claude Skills である。

別のチームは、Gitleaks/Trivy/Semgrep/Hadolint といった従来型のスキャン・ツールを利用して初期の発見事項を生成し、その後に、それらの発見事項にモデルを適用した。具体的には、OWASP/CWE フレームワークとの照合を行い、さらに個別の発見事項から攻撃経路を特定し、トリアージ段階における実行の可能性を検証した。

さらに別のグループは、パイプラインの各段階において、前段階の結果を読み取ることで検証を実施する、6 段階のエージェント型パイプラインを構築した。

強力な性能を発揮したフロンティア・モデル

このハッカソン・イニシアチブを通じて、複数の重要な教訓が得られたと、GC3 は述べている。

最も優れた成果は、構造化されたパイプライン内の厳密に範囲設定されたコンポーネントとして、フロンティア・モデルを利用したときに得られたものであった。従来の脆弱性管理ワークフローが、個別のタスクに特化したハーネスへと分解された。

適切なアーキテクチャとタスクの設計があれば、フロンティア・モデルは同様に、多くのニア・フロンティア・モデルおよびコード・スキャンで高い効果を発揮する。その一方で、問題を分解して広範なコンテキストを把握するためには、依然として人間の専門知識が不可欠であり、それが成果を左右する要素になった。

エージェントの速度は、人間が検証できる速度を上回る。したがって、発見され候補となる事項を生成するためのトリアージが不可欠であり、事前の慎重なスコープ設定と構造化された内部フィルタリングにより、焦点を明確化することでコストの削減にもつながる。このプロジェクト全体で、政府が負担したトークン費用は、わずか £13,000 ($17,467) であった。

次の大きな課題は、人間中心のプロセスを圧迫することなく、優先順位付け/レビュー/パッチ生成を統合することである。

しかし、Anthropic の Mythos/Fable モデルに対して、米国政府が導入した新たな禁輸措置が、このハッカソン・イニシアチブに与える影響は不明である。6月12日 (金) の深夜に発令された措置により、Anthropic が提供する最高性能モデルへのアクセスが、米国民以外のユーザーに対して遮断されることになった。