How DeepSeek changed the future of AI—and what that means for national security
2025/01/30 NextGov — 中国の DeepSeek が発表した内容は、米国の著名なツールと比べて、その構築に用いられるコンピューティング・パワーがきわめて少ないという、生成 AI へのアプローチの詳細である。その数日後に、国防総省における AI の購入/使用の方法から、米国人の生活やプライバシーに対して外国勢力もたらす混乱にいたるまで、AI と国家安全保障をめぐる世界的な議論が変化している。

この発表により DeepSeek は、ホワイトハウス/ウォール街/シリコンバレーから一斉に非難を浴びた。ワシントン DC ではトランプ大統領が、「これは、中国との競争に対してレーザービームのような集中が必要になるという、わが国の産業への警鐘だ」と称した。ホワイトハウスの報道官 Karoline Leavitt は、現時点において国家安全保障会議が、このアプリを審査中であると述べた。すでに海軍は、このアプリを禁止している。ウォール街では、チップメーカーの NVIDIA の株価が急落した。DeepSeek と競合する OpenAI は、このアプリは基本的に、自社のモデルを不正に抽出したものだと主張している。

2021年の時点で、元 Google 会長の Eric Schmidt と、元国防副長官の Robert Work が述べたように、「中国との戦略的な競争を激化させる AI 分野で、米国は勝たなければならない」と考えるなら、DeepSeek は大きな意味を持つ。
なぜ DeepSeek は、それほど重要なのか?まず、他のモデルと比べて、はるかにオープンソースであることだ。しかし、決定的な技術革新は、大規模なモデルから高度な推論機能を抽出し、より小さく効率的なモデル化できるという、そのモデルの能力にある。DeepSeek の1つのモデルは、大規模なオープンソースの代替モデルと比べて、優れたパフォーマンスを発揮することが多く、コンパクトな AI パフォーマンスの新しい基準を設定している。少なくとも、それは、きわめてパブリックな基準である。
DeepSeek は、強化された学習に大きく依存することで推論スキルを開発しており、OpenAI などのイニシャル・フェーズで用いられる、教師ありのファイン・チューニングを回避している。このアプローチは、米国の AI 大手が採用しているハイブリッド・トレーニング戦略とは意図的に異なるものである。
関連記事
Is ‘Big AI’ beating ‘small AI’—and what does it mean for the military?
Industry launches $100B AI-infrastructure effort to keep ahead of China
論文に記載されているベンチマーク結果によると、DeepSeek のモデルは推論集約型のタスクで非常に競争力があり、数学やコーディングなどの分野において、一貫してトップクラスのパフォーマンスを達成している。ただし、特に推論以外のタスクと事実に基づくクエリの精度において、OpenAI の最も高度な製品と比べて、いくつかの弱点があると、この研究は明らかにしている。
DeepSeek はベンチマーク結果を達成するために、大規模なコンピューティング・リソースを使用していない、つまり、本質的に OpenAI をコピーしていないとされる。そのことについて、誰も検証してはいないが、高性能マイクロチップに関する米国側の規制により、中国が利用できるリソースは制限されている。
AI モデルの評価も行っている Scale AI の CEO である Alex Wang は、「DeepSeek は OpenAI に匹敵する。また、高性能マイクロチップに関する輸出規制があるが、中国は5万個の NVIDIA の H100 チップを入手した」と、CNBC のインタビューで述べている。
なお、この主張に対して、NVIDIA の広報担当者は何も言及していない。ただし、この担当者は、「DeepSeek は、優れた AI の進歩を示す、テストタイム・スケーリングの完璧な例である。この方式は、新しい結果を生成するモデルが、データを取り込むときに計算能力を高めるものである。このように加えられた計算能力により、DeepSeek モデルは各種のオプションを探索して回答を改善できるため、より少ないトレーニング (より少ない計算) で、より良い回答を得ることが可能だ。その後に、このモデルは計算エネルギーを効果的に集中させていく。それは、訓練に似たものであり、最初はエネルギーを消耗するが、長期的にはエネルギーが蓄えられ、より効果的に能力を発揮するものになる」と、Defense One に対して語っている。
さらに、この NVIDIA の広報担当者は、「DeepSeek の研究成果が示すのは、広く利用可能なモデルと、輸出規制に完全に準拠した計算の活用により、新しいモデルを作成する方法である。推論には、多数の NVIDIA GPU と、高性能ネットワークが必要である。現時点において、3つのスケーリング法則がある。継続する事前トレーニング/事後トレーニング/新しいテスト時のスケーリングである」と述べている。
この DeepSeek における開発は、AI の優位性を築く方法に関する議論の、根本からの変化を示している。OpenAI などの企業は、膨大なデータセット/きわめて大規模なモデル/拡大し続けるコンピュータ・リソースに基づいて成果を上げてきた。しかし、AI の次のステップでは、より少ないコンピューティング・リソースだけを必要とする、より小さなモデルが登場するだろう。
この傾向は、GAFA などのテクノロジー大手を含む、大規模なエンタープライズ・クラウド・プロバイダーにとって、悪い前兆となるかもしれない。コンピューティング・リソースを大量に消費する、生成 AI 製品への需要を期待する数多くの企業により、代替アプローチは排除されてきた。しかし、AI の構築方法に関する議論の変化は、大規模なクラウド・リソースへの接続が不安定な場所であっても、堅牢なツールの利用を望む軍隊にとって朗報となる可能性がある。また、支出を抑えながら最高の AI 機能を獲得するという任務を負う国防総省にとっても、有益な道筋となるだろう。
人工知能の小さく新しい未来
OpenAI や大手エンタープライズ・クラウド・プロバイダーとは、まったく異なる道を描こうとしていた AI 研究者たちは、DeepSeek の躍進に驚いていない。
データ・サイエンティストである Drew Breunig は、「潤沢な資金だけが進歩への道である場合には、それに対して用心深くあるべきという点が、DeepSeek の勝利から得られる教訓である。この道が革新を促進しない一方で、制約内で作業せざるを得ない、小規模な競争相手は創造性を発揮し、最終的には、彼らが勝つ。お金をかけることが革新ではない」と、 Defense One に語っている。
最近のブログ投稿で、彼が説明しているのは、高性能モデルを作成するために必要な生データの量と計算能力、合成データにより削減する方法である。彼は、「この戦術は、大規模なモデルと同じ比率で、小規模なモデルに対してもメリットをもたらす」と述べている。
AI スタートアップ Useful Sensors の CEO である Pete Warden は、「巨大化していくモデルに対して、膨大な資金を費やすことが、AI を改善する唯一のアプローチではないことを、DeepSeek は示している。たとえば、TinyML がベースにする考え方は、トレーニング・コストが安い小型モデルを使用しても、大きな影響力を及ぼすアプリケーションの構築は可能だというものだ」と、Defense One に語っている。
大きな成果を生み出す小型 AI モデルの構築について、独創的な論文を執筆した Berkeley AI Ph.D 課程にある Ritwik Gupta は、「DeepSeek をめぐる誇大宣伝の多くは、それが正確に何であるかを誤解していると警告し、6710億のパラメータを持つ “依然として大きなモデル” である」と述べている。
彼は、「しかし、DeepSeek-R1 チームが、蒸留モデルのファースト・パーティ版を提供していることは極めて注目に値する。DeepSeek が行ったことは、15 億から 700 億のパラメータを持つ Llama と Qwen の小型バージョンに対する、DeepSeek-R1 の出力でのトレーニングである。それにより、ラップトップやモバイルなどの小型デバイスで、R1 のような モデルを動かせるようになる」と、Defense One に語っている。
DeepSeek のパフォーマンスを見る限り、国防総省が業界との話し合いにおいて有利になり、数多くの競合相手を見つけられるようになる。
Ritwik Gupta は、「DeepSeek と Qwen を複製する、米国の OSS を国防総省が採用しても驚かない。クラウドだけで提供されるサービスの、オンプレミス・バージョンとしての提供を求める方向で、常に国防総省は影響力を持っている。同省が、OpenAI と Claude に対して、このような要求をしても驚かない」と指摘している。
AI Now Institute の Chief AI Scientist である Heidy Khlaaf は、兵器システムと国家安全保障における AI の安全性を研究している。彼女は、「この画期的な進歩が現実のものであるなら、小規模な製造業者などに、生成 AI 利用の機会が開かれる可能性があるだろう。しかし、そのような状況での利用に注目が集まっても、そのようなモデルは戦闘には決して適さないだろう」と Defense One に対して述べている。
Heidy Khlaaf は、「信頼性と精度が求められる用途において、LLM などの基礎モデルではエラーが発生しやすいため、安全性が重要なタスクには適していないとされる。しかし、DeepSeek の規模と機能により、これまでアクセスできなかった小規模なアクターに、ベースとなるモデルの利用機会が開かれる。その中には、安全性が重要とされない方法での、ベース・モデルの活用に関心のある、自動車メーカーが含まれる可能性があるだろう」と述べている。
Berkeley Risk and Security Lab の Andrew Reddie は、「計算量を減らす方向での、AI モデルの方法を追跡してきた、私たちにとって、DeepSeek のパフォーマンスは驚くべきものではない。この画期的な進歩に対して米国の企業は、異なる方向へのイノベーションを追求する機会と見なすべきだ。 興味深いことに、中国の研究者が直面しているコンピューティングの課題は、つまり、NVIDIA GPU に関する米国の輸出規制の問題は、米国の学術界が直面している課題とそれほど変わらない」と、Defense One に述べている。
彼は、「すでに米軍は、コンピューティング能力を可能な限り戦闘員に近づけるために、エッジ機能に多額の資金を費やしている。小規模モデルにおけるパフォーマンスの飛躍的な進歩は、このようなエッジ・コンピューティングへの投資の価値が高まることを示している。軍事的なコンテキストにおいて、オープン/クローズドのモデルのどちらを採用するかという、きわめて興味深い問題もある。前者の利点は、政府ネットワーク内で移動しやすく、政府/軍のデータを活用できる点にある。その一方で、敵対国がトレーニング・データやモデルの重みなどが、敵対国に入手されやすくなるという、明らかなリスクがある」と指摘している。
DeepSeek の発表から得られる最も重要な教訓は、米国と中国の競争が何を意味するのかではなく、小規模化していくテクノロジー・プレーヤーのグループに懐疑的な人々にとって、どのような意味が生じるかというところにある。自社の利益を最優先に考えると推測される大企業のツールに頼るのではなく、自分で制御できるデータを使用して、独自の生成 AI ツールを構築したい人にとっては朗報である。
Berkeley の Ritwik Gupta は、「インターネットには、分散型のサービス群として繁栄してきた歴史がある。すべての人々が、自分専用の Personal AI を持つことに目標があるならば、個人用デバイス上で動作する小さなモデルが必要になるだろう。プライバシーを第一に考えるモデルを持つ Apple のような企業が、切断されたオフラインでのアルゴリズムを推進し続けると予想している」と述べている。
その一方で、AI Now Institute の Heidy Khlaaf は、「大規模なモデルを蒸留モデルに置き換えることは、個人にプライバシー・リスクをもたらす。個人データの漏洩は、民間人と同様に軍隊にも影響を及ぼし、敵対者による標的化などに対して脆弱になる」と警告している。
Heidy Khlaaf は、「軍の指導者が指摘しているように、米国人の個人データが広く漏洩することは、それ自体が国家としての脆弱性となり、紛争などの際に敵対者に利用される。それぞれの個人が、自身のデータを適切に保護するための包括的な改革がなければ、DeepSeek のような堅牢な小規模モデルの急増は、いまの脆弱な傾向をさらに悪化させる可能性がある。DeepSeek は、大規模モデルの方がパフォーマンスが高いという考え方に異を唱えている。この考え方は、大規模な AI モデルの構築に伴う、セキュリティとプライバシーの脆弱性を前提とすると、重要な意味合いを持っている」と述べている。
彼女は、「DeepSeek の蒸留技術により、大規模モデルの特性の多くを維持しながら、大規模モデルを小規模モデルに圧縮できる。ただし、ベース・モデルを自分のデータでトレーニングした国民にとっては、同じプライバシーの問題が、すべて DeepSeek の蒸留モデルに引き継がれることになる。そして、DeepSeek は米国の管轄下にはない。そのため、機密データで AI モデルをトレーニングすることは、国家安全保障上のリスクをもたらす」と警告している。
DeepSeekの登場により、AI 分野における国家間競争はますます激化しています。DeepSeekのような技術の拡大が安全保障やサイバーセキュリティに与える影響を考慮し、各国は慎重な対応を求められます。なお、関連する直近のトピックは、2025/01/30 の「DeepSeek からリークした大量のデータ:チャット・ログや機密情報が流出」となります。よろしければ、カテゴリ AI/ML と併せて、ご参照ください。
You must be logged in to post a comment.