BlackIce は AI ペンテスト環境:14 種類の AI セキュリティ・ツールを Docker コンテナで提供

BlackIce Introduced as Container-Based Red Teaming Toolkit for AI Security Testing

2026/01/29 gbhackers — CAMLIS Red 2025 で Databricks が発表した BlackIce は、14 個の広く利用されている AI セキュリティ・ツールを単一の環境に統合するために、オープンソース・ツールキットをコンテナ化したものだ。従来の AI レッドチームにおいてセキュリティ・テストのワークフローを阻害してきた、複雑なセットアップ手順や依存関係の競合といった重大な課題が、このイノベーションにより解消する。


AI レッドチームは、テストワークフローを分断する 4 つの障害に直面し続けている。

  1. セキュリティ・ツールごとに固有のコンフィグやセットアップ手順が必要であり、貴重なテスト時間を消費する。
  2. 依存関係の衝突により、ツールごとに別々のランタイム環境を維持せざるを得ない。
  3. マネージド・ノートブックはカーネルあたり 1 つの Python インタプリタに制限され、テストの柔軟性が制約される。
  4. 急速に拡大する AI セキュリティツールのエコシステムは、機能や実装要件に不慣れな新規参入者を萎縮させる。

Kali Linux のペンテスト基盤へのアプローチに着想を得た BlackIce は、事前コンフィグ済みツールを統合 Docker コンテナとして提供することで、これらの課題に対応する。

コア機能と統合ツール

このツールキットにバンドルされた 14 個のオープンソースツールは、Responsible AI/セキュリティテスト/敵対的機械学習の分野を網羅するために選定されたものだ。

そこに含まれるツールは、LM Eval Harness (GitHub stars 10.3K)/Promptfoo (8.6K stars) のような確立されたプラットフォームから、Microsoft の PyRIT (2.9K stars)/CyberArk の Fuzzy AI (800 stars) といった特化型ユーティリティまで多岐にわたる。

この多様な選択肢により、複数の攻撃ベクターをカバーする包括的な脆弱性評価が可能となる。

FeatureDescription
Containerized toolkitShips as a version-pinned Docker image for reproducible AI red teaming environments.
14 integrated AI security toolsBundles leading Responsible AI, adversarial ML, and security testing tools in one image.
Unified CLIExposes tools through a single command-line interface for shell and notebook workflows.
Static and dynamic tool modesStatic tools via simple CLI, dynamic tools with Python-based customization for advanced attacks.
Isolated environments for static toolsUses separate virtual envs/Node.js projects to avoid dependency conflicts.
Global environment for dynamic toolsCentralized Python environment managed via a shared requirements configuration.
Databricks-native integrationPre-patched to talk directly to Databricks Model Serving and workspace endpoints.
Framework-aligned coverageMapped to MITRE ATLAS and DASF to cover prompt injection, jailbreaks, leakage, and hallucinations.
Supply chain and artifact scanningSupports detecting unsafe AI artifacts and malicious model files.
Cloud-friendly deploymentDesigned to run via Databricks Container Services for scalable AI security testing.

BlackIce は、一連のツールを 2 種類の運用カテゴリに整理している。

Static ツール:プログラミングに関する前提知識をほとんど必要としないコマンドライン (CLI) 評価を提供し、迅速なテスト・ワークフローを可能にする。

Dynamic ツール:同等の機能に加えて、高度な Python ベースのカスタマイズを提供し、セキュリティ・エンジニアにより洗練されたカスタムな攻撃シナリオの構築を支援する。

コンテナ内において、Static ツールは独立した Python 仮想環境や Node.js プロジェクトとして保持され、CLI から直接利用できる。Dynamic ツールはグローバル Python 環境上で動作し、依存関係は集中管理されたコンフィグにより制御される。

セキュリティ・カバレッジ・フレームワーク

MITRE ATLAS および Databricks AI Security Framework (DASF) に対して、BlackIce の機能をマッピングする Databricks は、包括的な脅威モデリングとの整合性を確立している。

このツールキットが対応するのは、プロンプト・インジェクション/LLM Jailbreak/RAG システムにおける信頼できないコンテンツ経由の間接プロンプト・インジェクション/LLM データ漏洩、Hallucination (幻覚) 検出/敵対的サンプル生成/悪意あるコードを取り込んだサプライチェーン・アーティファクトのスキャンといった重要な脆弱性のクラスである。

この多層的なカバレッジにより、モデルレベルの攻撃から、アプリケーション層の脅威や、インフラの脆弱性に至るまで、AI セキュリティ全体にわたる弱点が特定される。

BlackIce は Databricks の Docker Hub で提供されており、標準的なコンテナ・コマンドを用いてデプロイ可能である。ユーザーは、Databricks Container Services を利用してコンピュート・クラスターをコンフィグし、クラスター作成時に BlackIce イメージ URL を指定する。

このツールキットは、イメージ構築時に適用されたカスタムパッチにより、Databricks Model Serving エンドポイントとシームレスに統合され、速やかなワークスペースの確保と互換性が保たれる。

GitHub リポジトリには、詳細なビルド・ドキュメントが用意されており、ツール選定のカスタマイズやバージョン更新管理などが、ユーザー組織の方針に合わせて独自に行われる。

デモ・ノートブックで示される例は、統合環境内で複数のセキュリティツールがオーケストレーションされ、包括的な脆弱性評価を実施するモデルである。

“docker pull databricksruntime/blackice:17.3-LTS” によりツールキットへアクセスし、Databricks Container Services を通じてコンピュート環境を構成できる。

付属のデモ・ノートブックおよび GitHub リポジトリは、セキュリティ・テスト・ワークフローを速やかに導入するための、実装例とアーキテクチャ・ガイダンスを提供する。

BlackIce は、複雑なツール統合の課題を回避しながら、厳格な脆弱性評価を実現することで、AI セキュリティ・テストの民主化における重要な前進を示している。