Major Organizations Using ‘Hugging Face’ AI Tools Put at Risk by Leaked API Tokens
2023/12/05 SecurityWeek — Hugging Face/GitHub などのコード・リポジトリに、誤って公開されている 1,600以上の有効な Hugging Face API トークンを、AI サイバー・セキュリティ・スタートアップである Lasso が発見した。トークンなどの機密情報が流出し悪用されると、きわめて高いリスクにいたることから、コードホスティング・プラットフォームやセキュリティ研究者たちかは、以前から注視し続けている。LLM (Large Language Models) を統合する開発者や企業は、Hugging Face API トークンにより、Hugging Face リポジトリの管理を可能にする。

ML (Machine Learning) アプリ構築ツールのプロバイダーである Hugging Face は、LLM プロジェクトの開発者にとって人気のあるリソースだ。同社のリポジトリでは、何十万もの AI のモデル/データセットへのアクセスが提供されている。
2023年11月に Lasso の研究者たちは、Hugging Face と GitHub の両方に公開された Hugging Face API トークンを探し始め、両プラットフォーム上で 1681 の流出した有効なトークンを発見した。それらのトークンは、Google/Meta/Microsoft/VMware などの大組織に関連する 、723の組織のアカウントへのアクセスを提供していたと、研究者たちは指摘している。
Lasso は、「これらのアカウントのうち、655人のユーザーのトークンには、書き込み権限があることが判明した。そのうちの 77人は、さまざまな組織に属していた」と述べている。同社によると、それらのトークンの中には、数百万のダウンロード・モデルを所有する組織のアカウントに、フルアクセスできるものもあったという。
さらに Lasso は、「我々は、何百万ものダウンロード数を誇る企業を掌握することで、既存のモデルを操作し、潜在的に悪意のものへと変えてしまう可能性も発見した。もし、アプリケーションに破損したモデルが注入されると、それらのモデルに依存している何百万人ものユーザーに、影響がおよぶ恐れがある」と詳述している。
さらに Lasso が指摘するのは、流出したトークンにより、プライベート・モデルの盗難にいたる可能性が生じることだ。また、対象となるリポジトリでトレーニング・データ・ポイズニングが生じ、ML モデルの完全性に影響を及ぼす攻撃が成立する可能性もあるという。
同社による調査中に、Hugging Face は org_api トークンを非推奨とし、Python ライブラリでの使用をブロックした。それにより、影響を受けたリポジトリへの書き込みパーミッションは実質的に削除されたが、読み取りパーミッションはブロックされていない。
Lasso によると、影響を受けたユーザーと組織には調査結果を通知し、その多くがトークンを取り消し、パブリック・アクセス・トークンコードを削除するなどの措置を即座に取ったという。Hugging Face にも調査結果が通知された。
Hugging Face という AI コミュニティのことを、初めて知りました。文中でも説明されていますが、Google/AWS/Microsoft などを含む、50,000 以上の組織に利用されているとのことです。これまでの、各種のリポジトリに蓄積されたノウハウがあるので、新しい分野でのコードの共有なども、素晴らしいスピードで進んでいくのでしょう。しかし、セキュリティの面は、どうしても後回しになってしまうのかもしれませんね。

You must be logged in to post a comment.