京都大学の 77TB の研究データが消えた:HP バックアップ・システムのエラーが原因

University loses 77TB of research data due to backup error

2021/12/30 BleepingComputer — Hewlett-Packard 製スーパー・コンピュータのバックアップ・システムのエラーにより、日本の京都大学が、約 77TB の研究データを失った。この事故は、2021年12月14日〜16日に発生し、14の研究グループにおける 3,400万ファイルが、システムおよびバックアップ・ファイルから消去された。この損失の影響を調査した結果、京都大学は、影響を受けたグループのうち、4つのグループの作業は、もはや復元できないと判断した。

影響を受けた全ユーザーに対して、個別の電子メールで通知が行われたが、失われた作業の種類についての詳細は公表されていない。現時点では、バックアップ・プロセスが停止している。データ損失の再発を防ぐために、同大学はバックアップ・システムを廃棄し、2022年1月に改善を適用して再導入する予定だ。また、フルバックアップ・ミラーだけでなく、増分バックアップ (前回のバックアップ以降に変更されたファイルを対象) も行う予定とのことだ。

スパコンは高価

失われたデータの種類について、詳細は公開されなかったが、スーパー・コンピュータの研究には1時間あたり数百米ドルの費用がかかるため、今回の事故により被害を受けたグループに苦痛が生じたことは間違いない。京都大学は、日本で最も重要な研究機関の一つと考えられており、国からの補助金による科学研究費の投資額は第2位である。

その研究の卓越性と重要性は、世界第4位の化学分野で特に際立っており、また、生物学/薬理学/免疫学/材料科学/物理学などへの貢献も大きい。京都大学には、今回の事件の詳細と、研究グループへの影響について説明を求めましたが、まだ回答は得られていない。

世界をリードする日本

日本には、神戸にある理化学研究所計算科学センターが運営する、現時点で世界最強のスーパーコンピュータ「富嶽」がある。富嶽は富士通が開発するエクサスケール・システムであり、442PFLOPS という演算性能を誇っている。世界ランキング2位の IBM Summit は、148PFLOPS という、はるかに低い数値となる。富嶽の構築には $1.2 billion が費やされ、これまでに COVID-19 の研究/診断/治療/ウイルス拡散のシミュレーションなどに使用されてきた。

なんで、こうなってしまったのだろうと、誰もが思う出来事です。2021年9月に「インサイダーからの攻撃:過失と 故意と 復旧と」をポストしています。ちょっと長めの記事ですが、項目としては「企業と国家に対するインサイダーの脅威」、「誤操作と悪意」、「復旧戦略の優先順位」があり、よく整理されています。よろしければ、ご参照ください。

%d bloggers like this: