情報系ソフトやWEBサービスなど

さくらブログが5/4に復旧し記事内容も無事に回復、しかしこれほど大規模長時間の障害になった原因は何?

この記事は約2分で読めます。

さくらブログが5月4日早朝に復旧さくらブログのシステム障害が5月4日早朝に復旧していた。のべ3日間という障害も一応の収束だ。しかしなぜこれほど大規模に長時間の障害となったのか。今回の障害の主要原因はHD(ディスク)の障害よりむしろ制御装置(システム)にありそうだ。HDは消耗品でありであり壊れるものだ。当然、データセンタであればHDはいつか壊れることを前提に、データの二重化等の複数の保全策をシステムとして準備していたはず。今回の障害もすべてのHDが同時に壊れたわけでないだろうから、HD故障は1個か数個程度の限定的なものだったと推測できる。それなのになぜすべてのシステムが停止したのか?
障害が限定的なところで止められず、さくらブログシステム全体におよぶ広範囲の障害を発生させてしまったことには経営上も悪影響を及ぼしそうだ。

さて、昨日は19位。今日は何位かな?⇒ぽちっとクリックお願いします

▼さくらインターネットの告知
さくらのブログにおける長時間の停止に関するお詫び

2008/05/04 掲載 

お客様各位

平素より、さくらインターネットをご利用頂き、厚く御礼申し上げます。

5月2日早朝に発生致しました、さくらのブログに関する機器障害に伴い、
復旧まで長時間にわたりブログが表示できない状態が続きました
ご利用のお客様には、多大なご迷惑をお掛け致しましたこと、深くお詫び
申し上げます。

今回の障害について、お客様のブログ記事を格納するディスク装置の不具合
が原因であり、当該装置の交換により復旧を致しております。
なおディスク装置については、ディスク本体の故障時でもサービスが停止する
ことなく、データの安全性も保障される構成がなされておりましたが、今回は
制御装置の故障により著しく速度が低下する状況となっておりました。
そのため、復旧作業については制御装置の交換を予定しておりましたが、
交換直後のデータ消失に関するリスクを回避するために、最新状態データの
コピー作業を行っており、復旧までに時間を要する状況となりました。

今後、原因の究明および復旧体制の検証を行い、再発防止に努めてまいります。

※調査報告につきましては、完了次第、当社ウェブサイトにおいて公表を
  させて頂きます。

平成20年5月4日
さくらインターネット株式会社
代表取締役社長 兼 最高経営責任者
田中 邦裕