DeepSeek からリークした大量のデータ:チャット・ログや機密情報が流出

DeepSeek AI Leaks Over a Million Chat Logs and Sensitive Data Online

2025/01/30 HackRead — 中国の AI 企業 DeepSeek が、OpenAI のシステムに匹敵する AI モデルで名を馳せている。しかし、同社の台頭につれて、深刻なセキュリティ問題が発生している。Wiz の研究者が発見したのは、同社に関連付けられたデータベースが一般公開されており、100 万件を超えるログ・エントリ/バックエンドの詳細/ソフトウェア・キーなどが公開されている状況である。

問題の発見の経緯

定期的なセキュリティ評価中に Wiz の研究者たちが発見したのは、DeepSeek に保護されていない ClickHouse データベースの存在であり、インターネットにアクセスできる誰もがアクセスできる状態であることだった。このデータベースは、単に表示が可能であるだけではなく、保存されたデータの完全な制御が可能であるため、重要な情報に対する制限のない操作/抽出が、攻撃者に許されてしまう。

公開されたデータベースは、以下のサブ・ドメインにリンクされていた。

  • dev.deepseek.com:9000
  • oauth2callback.deepseek.com:9000

ClickHouse は、大規模なデータセットに対する、分析クエリを迅速に処理するように設計された、OSS のカラム指向データベース管理システムである。もともと Yandex により開発されたツールであり、リアルタイムでのデータ分析/ログ処理/ビジネス・インテリジェンスに広く使用されている。

Wiz のブログ投稿によると、同社の研究者たちは認証を必要とせずにシステムを照会し、以下の情報を取り込んだ膨大な量のログを発見した。

  • API キー
  • チャット履歴
  • バックエンド・サービスの詳細
  • システム運用メタデータ

これは単なるミスコンフィグではない。このデータベースには、内部システム・アクティビティの詳細なログが含まれており、DeepSeek の AI ツールの動作と通信方法が公開されていた。さらに悪いことに、この公開情報を悪用する攻撃者は、コマンド実行を達成し、さらに機密性の高いデータをサーバからダイレクトに抽出できるようになる。

DeepSeek AI Leaks Over a Million Chat Logs and Sensitive Data Online
DeepSeek leaking chat logs in plain text (Via WIZ)
DeepSeek AI Leaks Over a Million Chat Logs and Sensitive Data Online
(Via WIZ)
DeepSeek AI Leaks Over a Million Chat Logs and Sensitive Data Online
Researchers accessed 976,000 DeepSeek logs within minutes (Via WIZ)
何が危険にさらされるのか?

DeepSeek の AI サービスは、ユーザーが生成する大量のデータを処理するため、個人情報や独自の情報がチャット・ログに含まれる可能性がある。また、このデータベースには、API キーも保存されているため、その悪用に成功した攻撃者には、DeepSeek サービスの偽装や、内部システムへのアクセスの機会が提供される可能性もある。

一般論として、AI スタートアップのケースを考えると、開発速度が優先されセキュリティが後回しにされることが多い。今回のケースでは、単純なセキュリティの不備により貴重な内部データが露出し、サイバー犯罪者に悪用される可能性が生じている。

DeepSeek の対応

Wiz からの通知を受けた DeepSeek は、すぐにデータベースをロックダウンし、一般アクセスを禁止した。ただし、情報が保護される前に、権限のない者によるアクセスがあったのかどうかは不明である。

DeepSeek::プライバシーとサイバー・セキュリティの懸念

DeepSeek の所有権が中国にあるという状況は、すでに西側諸国の政府の間で懸念を引き起こしている。また、一部の批評家は、そのチャットボットが過剰な個人データを収集し、プライバシーのリスクをもたらすと主張している。これらの懸念に加えて、前日に DeepSeek は、大規模な攻撃について報告し、新規ユーザー登録を停止せざるを得なくなった。そして今、データベースが公開され、機密情報が漏洩したことで、さらなるサイバー・セキュリティ上の障害に、同社は直面している。

専門家の意見

Cobalt の CTO である Gunter Ollmann は、「DeepSeek で生じた問題は、製品の立ち上げと実行のプロセスが、セキュリティよりも優先されるため、往々にして発生するものだ。また、DeepSeek は、AI の世界で重要な位置を占めているため、企業や個人のユーザーにとって甚大な被害が生じている可能性がある」と指摘している。

彼は、「DeepSeek における情報の漏洩が浮き彫りにするのは、重大な問題が繰り返して発生している状況である。特に AI の世界において、急速な革新を進めている組織は、セキュリティよりもスピードを優先することが多い。Wiz の発見は、クラウドベースのインフラと公開 API により攻撃対象領域が拡大する中で、プロアクティブなセキュリティ ・テストが重要であるという状況を改めて示している」と付け加えている。

中国の生成 AI である DeepSeek に、チャット・ログや機密情報の流出に繋がる、セキュリティ上の脆弱性が発見されました。AI 技術の進歩と普及が加速する中で、データ漏洩のリスクもまた増大しています。今回の件は、利便性とセキュリティのバランスの重要性を改めて浮き彫りにしました。今後、各社がどのような対応を取るのか、引き続き注視していきたいところです。よろしければ、カテゴリ AI/MLも、ご利用ください。