Augustus – Open-source LLM Vulnerability Scanner With 210+ Attacks Across 28 LLM Providers
2026/02/10 CyberSecurityNews — Praetorian が公表したオープンソースの脆弱性スキャナー Augustus は、進化し続ける敵対的脅威の状況から LLM を防御するために設計されたものだ。この Augustus は、学術研究向けツールと本番環境向けセキュリティ・テストの間に存在するギャップの解消を目的として提供される。具体的には、単一のバイナリを用いることで、28 の LLM プロバイダーに対して、210 種類以上の敵対的な攻撃を実行できる。

それぞれのユーザー企業が GenAI 製品の統合を加速させる中で、CI/CD (Continuous Integration/Continuous Deployment) パイプラインへの統合においてセキュリティ・チームを悩ませているのは、研究志向のツールや動作の遅いツールの存在である。
NVIDIA の garak のようなツールは、包括的かつ標準的なテストを確立しているが、複雑な Python 環境や多数の依存関係を抱えている。
Augustus は、単一でポータブルな Go バイナリとしてコンパイルされ、こうした運用上のボトルネックに対処するものである。このアーキテクチャにより、Python ベースのセキュリティ・ツールにありがちな依存関係の困難さが解消され、仮想環境/pip のインストール/特定のインタプリタ・バージョンなどが不要となる。
また、このツールは、Go ネイティブのコンカレンシー・プリミティブ (goroutine) を活用し、大規模な並列スキャンを実現する。それにより、従来のツールよりも大幅に高速化され、リソース効率の高い動作を可能にしている。
Praetorian のリリース・アナウンスには、「オペレータの作業方法に適したものが必要だった。それは、既存のペンテスト・ワークフローに適合する、高速でポータブルなバイナリである」と記されている。
210 以上の攻撃モード
Augustus の中核は、AI モデルのレッドチーミングを自動化する攻撃エンジンである。このツールには、47 の攻撃カテゴリーをカバーする、210 以上の脆弱性プローブが同梱されている。
- Jailbreak:安全フィルタを回避するために設計された高度なプロンプト (例 : DAN/AIM/Grandma エクスプロイト)。
- Prompt Injection:システム指示を上書きするための手法であり、Base64/ROT13/モールス符号といったエンコーディング・バイパスを含む。
- Data Extraction:PII 漏えい/API キーの開示/学習データの再構築を検証するテスト。
- Adversarial Examples:モデルの推論を混乱させることを目的とした、勾配ベース攻撃やロジック・ボム。
Augustus の際立った特徴として挙げられるのは、”Buff” システムである。これは任意のプローブに対して、変換を動的に適用できる仕組みである。テスターは、プロンプトの言い換え/低リソース言語 (例 : ズールー語やスコットランド・ゲール語) への翻訳、詩的形式でのエンコードなどの、複数の “Buff” を連鎖させて適用できる。
標準的な攻撃は防げるが、わずかに形を変えた同一の攻撃を認識できないという、脆弱なセーフティ・フィルタを発見する上で、この機能は極めて重要である。
現代的なセキュリティ・スタックを前提に設計された Augustus は、OpenAI/Anthropic/Azure/AWS Bedrock/Google Vertex AI といった主要プラットフォームに加えて、Ollama のようなローカル推論エンジンを含む、28 種類の LLM プロバイダーを標準でサポートする。
これにより、クラウド・ホスト型の GPT-4 モデルから、ローカルで稼働する Llama 3 インスタンスまで、同一のツールによるテストが可能になる。
このツールのアーキテクチャは、本番環境での信頼性を重視しており、大規模評価時のスキャン失敗を防ぐために、レート制限/リトライ・ロジック/タイムアウト処理が組み込まれている。
テストの結果は、JSON/ストリーミング・ログ向けの JSONL/ステークホルダー向けの HTML などの複数形式による出力が可能であり、脆弱性管理プラットフォームや SIEM への取り込みが容易である。
Augustus は、Praetorian が展開するオープンソース・シリーズ “12 Caesars” の第 2 弾であり、LLM フィンガープリンティング・ツール “Julius” に続くリリースである。Apache 2.0 ライセンスのもと、直ちに利用できる。
セキュリティ担当者および開発者は、GitHub からの最新リリースのダウンロードや、ソースからのビルドも可能となる。
LLM 向け脆弱性スキャナー Augustus が登場しました。この背景にあるのは、GenAI の普及に伴い、プロンプト・インジェクションなどの新しい攻撃手法が次々と登場し、従来のセキュリティ・ツールでは対応しきれないという問題です。Augustus は、単一の高速なバイナリとして設計されており、AI モデルの安全フィルターが持つ隙間を 210 種類以上の攻撃パターンで網羅的にテストします。AI 特有の、推論の脆さを可視化するものとして期待されます。よろしければ、カテゴリー SecTools も、ご参照ください。
You must be logged in to post a comment.