Atlassian のクラウド障害:影響を受けたアカウント数は 800件だがデータ損失は軽微

Atlassian doubles the number of orgs affected by two week outage

2022/04/30 BleepingComputer — Atlassian によると、4月の2週間にわたって発生した、クラウド障害により被害を被った顧客数が、事故発生当時の見積数の約2倍に膨らんでいるという。同社の Chief Technology Officer である Sri Viswanath が、事故発生から9日後の 4月14日に明らかにしたように、レガシーアプリの無効化に取り組む2つの Atlassian チーム間のコミュニケーションの問題により、誤ったメンテナンス・スクリプトが実行され、数百もの顧客サイトが消去されてしまった。

非アクティブ化を進めるチームに対して送られてきたのは、それらのレガシー・アプリの無効化に必要な ID ではなく、アプリがインストールされているクラウド・サイトの ID だったようだ。また、そのスクリプトは、リカバリ・フェイルセーフでデータを削除するのではなく、データを永久に削除するという、間違った実行モードで起動された。

この 14 日間にわたる障害は、4月5 日〜4月18日において、ごく少数の Atlassian 顧客に影響を与えた。影響を受けたサイトの最初のグループは4月8日までに、残りの顧客サイトは 4月18日までに復旧している。この間において、Jira/Confluence/Atlassian Access/Opsgenie/Statuspage などの Atlassian 製品が、それらの顧客の間では利用できなくなった。

この障害により 775 の顧客に影響が生じた

この障害が最初に報告されたときに Atlassian は、200,000 以上のクラウド顧客のうち、約 400 のサイトが消去されたと伝えていたが、金曜日になって Viswanath は、ほぼ2倍の顧客に影響が生じたことを明らかにした。

このインシデントの調査中に集められたデータを分析した結果、Atlassian が見積もる影響を受けたアカウント数は、非アクティブ/無料/小規模なユーザーも含むように変更された。Viswanath は、「その結果、2022年4月5日 (火) 07:38 UTC〜08:01 UTC の間に、883 サイト (775 顧客に相当) が削除されたことが分かった。大きなインシデントだったが、5分以上の更新量に相当するデータを失った顧客はいない。また、99.6% 以上の顧客は、復旧作業中も支障なく当社のクラウド製品を使用し続けることができた」と述べている。

Confluence や Insight のデータベースが復元され、5分間分のデータを失ったアトラシアンの顧客は少数だったが、その数分のデータを復元するよう、Atlassian は取り組んでいるという。Viswanath は、「残りのデータを復旧し、この影響を受けた顧客に連絡を取り、さらにデータを復旧するための変更を適用しておく」と付け加えている。

Atlassian outage timeline
Outage timeline (Atlassian)

サイバー攻撃によるものではない

当初 Atlassian は、復旧作業に数日以上かかることはないと見積もっていた。また、今回の障害は、サイバー攻撃や内部からの悪意ある行為によるものではないため、顧客のデータは不正アクセスされていないことを確認していた。

Viswanath は、「データ損失はなく、サイバー攻撃によるものではない、という重要なメッセージを繰り返し伝えるながら、今回の障害につい一般にも広報することが、正しいアプローチだっただろう。全容が明らかになるまで待つのではなく、何がわかっていて、何がわかっていないのかを、明らかにすべきだった。一般的な復旧予測を提供し、より完全な状況を把握する時期を明確にすることで、顧客サイドとしても、今回のインシデントに対して、より適切な計画を立てることができたはずだ」と述べている。

同社のクラウド製品を利用している顧客に対して、このインシデントは影響を与えることになったが、2021年2月からはオンプレミス製品のライセンスを販売しないという、Atlassian の方針を揺るがすものになってはならない。Atlassian の CEO である Scott Farquhar は、現時点で利用されているオンプレミス・ライセンスのサポートは、3年後の2024年2月2日に打ち切ると付け加えている。

このインシデントについては、4月11日に「Atlassian のシステム・ダウン:復旧までに更に2週間が必要な顧客もいる」という記事をアップしていて、今回の記事は続報となります。たしかに、前回の記事では、約 400社に影響が生じたとされていますが、それが 755社に増えたようです。ただし、復旧は進んでいるようなので、このインシデントへの対応も完了するのでしょう。Atlassian 側のミスは、「スクリプトが、データを永久に削除するという、間違った実行モードで起動された」というものですが、それが復旧するということは、一度クラウドに上げたデータは、なかなか消えてくれない、ということの証明でもありますね、

%d bloggers like this: