Cloudflare のダウンと広範な影響:被害者となった Hackread が語る根本的な問題とは?

Cloudflare Outage Jolts the Internet – What Happened, and Who Was Hit

2025/11/19 hackread — 2025年11月18日の朝のことだが、世界中の Web ユーザーがエラーページなどに遭遇し始めた。この障害の原因は、世界の Web トラフィックの約 20% を処理する、Web インフラ企業である Cloudflare, Inc. にあり、Hackread.com の読者も被害者となった。

何が起きたのか

東部標準時午前 6時40分頃 (世界標準時の午前 11時40分) に、Cloudflare が記録したのは内部サービスの低下である。その原因は、異常に大規模なトラフィック・イベントがサービスの1つに発生し、ネットワーク全体のエラー率が上昇したことにある。同社のステータス・ページには、ボット管理やエッジ・ネットワークといった、コア機能のパフォーマンス低下が表示された。

Cloudflare Outage Jolts the Internet - What Happened, and Who Was Hit

その日の遅くに Cloudflare の CTO である Dane Knecht は、「率直に言うと、今日の早朝に @Cloudflare のネットワークに問題が発生し、当社に依存する大量のトラフィックに影響が出たことで、ユーザーとインターネット全体に迷惑をかけてしまった」と、この障害について述べた。

Knecht が明言したのは、ボット対策を支えるサービスの定期的なコンフィグ変更により引き起こされた、潜在的なバグに根本的な原因があるという内容だ。このバグがネットワーク全体に広範なトラフィック・エラーを引き起こしたが、何らかのサイバー攻撃が発生したわけではないと強調していた。

その後に Cloudflare は、「修正プログラムが実装され、インシデントは解決したと考えている。すべてのサービスが正常に戻るよう、引き続きエラーを監視している」と発表した。

影響を受けた人々

Cloudflare は、多数の Web サイトやプラットフォームのコンテンツ配信およびセキュリティ・レイヤーとして機能しているため、その影響が広範囲に波及した。

サービスで障害が発生したブランドには、Hackread/Canva/Uber/IKEA/Shopify/League of Legends/DoorDash/Discord/Patreon/Medium/Crunchyroll/GitLab/Udemy などがある。

ChatGPT などの人気 AI ツールや他の LLM サービスでは、機能停止や高いエラー率が報告された。また、ソーシャルメディア・プラットフォーム X (旧 Twitter) でも、障害が発生した。

その他にも、Cloudflare のネットワークに依存しているストリーミング/ゲームなどのサービスや、大規模 Web アプリ、企業ドメインでエラーが報告された。

ユーザーからの障害報告を追跡する Downdetector は、影響を受けたサービスの報告において、ピーク時には数万件を示していた。しかし、このプラットフォーム自体も Cloudflare 関連の問題に直面していた。

Cloudflare Outage Jolts the Internet - What Happened, and Who Was Hit

Cloudflare は Apple や Google のような有名ブランドではないが、インターネットの機能とセキュリティの大部分が Cloudflare に依存している。このようなサービスが大量のトラフィックを扱っている場合に、そこで生じた障害は1つのサイトのダウンから、大規模なサービス中断へと急速に拡大する可能性がある。

依然として問題を抱えるサイト

この問題は解決したと Cloudflare の CTO は述べているが、X のユーザーたちは完全には正常化されていないと指摘している。Hackread.com を含む多くのサイトで、読み込み速度の低下や、ダッシュボード内の問題に加えて、Cloudflare のエラー・ウィンドウへのリダイレクトだけではなく、下書きの保存やログイン・ページへのアクセスに問題が生じている。

一部のユーザーから上がっている報告には、Cloudflare にログインできない、または、パソコンでもスマートフォンでもサービスにアクセスできないというものがある。

前回の大規模な障害からというもの、インターネットは息をつく間もない状況に追い込まれている。Hackread.com のレポートに詳述されているように、わずか1ヶ月前には AWS がダウンし、無数のサービスがオフラインになった。そして今、Cloudflare も独自の障害に対処しているが、コアとなる Web インフラに短期間に2回の大規模障害が発生したことになる。

Alkira の VP of Product Management and Compliance である Misbah Rehman は、「今日の Cloudflare の障害が改めて認識させるのは、インターネットには依然として脆弱なチョークポイントが存在することだ。きわめて優れたアーキテクチャを備える大手グローバル・サービス・プロバイダーであっても、そこに問題が生じると、業界全体のダウンストリーム・アプリケーションが影響を受けることになる」と、述べている。

さらに彼は、「AI 駆動型アプリケーションがリアルタイムの信頼性を要求するにつれ、単一の脆弱なクラウドに依存しているネットワークは、プロバイダー非依存で回復力のあるファブリックへと移行する必要がある。つまり、単一のプロバイダー/クラウド/ネットワーク層が常に利用できることを前提としない、新たなインフラの構築を意味する。設計の段階から回復力のある構造を持ち、基盤となるインフラから制御プレーンを分離し、あらゆる場所で一貫したポリシーを適用できる環境が必要となる。そこでは、ユーザー企業が、クラウド/リージョン/パートナー間でルーティング/フェイルオーバーを即座に実行し、問題の分離も可能にする必要がある」と付け加えている。