OpenAI が拡張する防御のモデル:AI の規模と精度が従来型の脅威と組み合わされる時代に

OpenAI Enhances Defensive Models to Mitigate Cyber-Threats

2025/12/12 InfoSecurity —12月10日 (水) に OpenAI が発表したのは、モデル性能の急上昇に伴い社内計画を再構築したという声明である。そのレポートによると、Capture The Flag (CTF) チャレンジを用いた能力評価は、2025年8月の GPT-5 における 27% から、2025年11月の GPT-5.1-Codex-Max の 76% へと向上しているという。OpenAI が警告するのは、今後登場するシステムの一部が、同社の Preparedness Framework における高能力レベルに達する可能性である。そのレベルに達すると、複雑な侵入作戦からゼロデイ・エクスプロイトの開発に至るまでの、さまざまなタスクが支援されてしまう可能性があるという。

その一方で、ThreatAware の共同創設者兼 CEO である Jon Abbott は、基本的な保護に重点を置く必要性を強調するものだと述べている。

彼は、「新しいモデルがサイバー・セキュリティ・リスクを助長するという OpenAI の警告は、セキュリティ基盤を正しく構築することの重要性を示している。AI は攻撃のペースを加速させているかもしれないが、私たちにとって最善の防御策は、基本を確実に固め続けることにある」と述べている。

ThreatAware は、高度な能力を防御成果へと結びつけるための、多層的な安全対策を開発し、攻撃の可能性に備えている。その主な目標は、依然としてリソースが不足しているセキュリティ・チームの立場を強化することだと、同社は付け加えている。

業界全体の理解強化

サイバーワーク・フローに内在する、悪意を持った使用のリスクを管理するために、同社は複数の要素に基づく多層防御戦略の概要を示した。

  • アクセス制御/インフラ強化/制御と監視の出力
  • 教育と防御における有用性を維持しながら、モデルを有害なリクエストから遠ざけるトレーニング
  • 安全でないアクティビティをブロック/リダイレクトできるシステム全体の検出ツール
  • 外部専門家によるエンド・ツー・エンドのレッドチーム演習

ThreatAware は、「これらの安全対策は、脅威の状況に合わせて進化するよう設計されている。攻撃側の能力の向上により、長年わたり存在する脅威がより危険になる。AI が実現する規模と精度が、従来型の脅威と組み合わされると、きわめて有害な脅威になる。実用的なゼロデイ・リモート・エクスプロイトの開発や、複雑でステルス性の高い侵入を支援するモデルにより、犯罪者の参入障壁は劇的に低下している」と述べている。

その一方で OpenAI は、防御 AI の実世界への応用を向上させるために、世界中の専門家と連携しているという。さらに、その結果を評価し得るユーザー向けに、信頼に足るアクセス・プログラムを準備していると述べた。

もう一つの取り組みである Aardvark は、すでにプライベート・ベータ版が稼働している。このエージェント型セキュリティ調査機能は、コードベース・スキャンによる脆弱性の特定とパッチの提案に加えて、オープンソース・プロジェクトにおける新たな CVE の発見にも寄与している。

OpenAI は、責任ある能力の利用について助言を行う、Frontier Risk Council の立ち上げと Frontier Model Forum の展開を通じて、脅威モデルの共通化および改良と、エコシステム全体の緩和戦略の改善を目指すと述べている。