りおパパの日記

徒然なるままに。ドトールのコーヒーが好きです。

ポストモーテム みずほ銀行障害 事後検証報告

日経コンピュータから出版された「ポストモーテム みずほ銀行システム障害 事後検証報告」を読みました。第1章は12カ月で11回、どんな障害が起こったかの紹介。読んでいてそれだけで居た堪れなくなった。このシステムの担当者だったらと思うと、何とも絶望的な気分になっていたことだろう。多分、そういう気持ちにもなれないほど走り続けなければならなかった1年なんじゃないかと思う。こういう文章を読むと、システム部でやっていく自信が揺らいでしまう。

第2章から、第3章、第4章が本題。第2章行内で何が起きたのか、システム障害の真相、第3章なぜ障害が拡大した、15の疑問点、第4章金融庁が分析する「原因」「背景」「真因」。あとがきにもあるようにこれらの文章は日経コンピュータの「動かないコンピュータ」で書かれた記事をベースに加筆されたもの。全体がまとまっているのは良いが、内容としては既に読んでいたものが多い。でも、改めて思ったのは、このシステムがマルチベンダーであるだけでなく、複数のプラットホームを組み合わせるような形のアーキテクチャであったこと。そして、こうしたサブシステムをまたがる形のグローバルトランザクションを実行する作りであったこと。システムの頑健性を高めるために、サブシステム間を疎結合にするのは、ある意味時代の潮流だと思うけど、グローバルトランザクションといわれると、そこはモノリシックの方が良さそうなのは素人にも判るような気がする。DBMSミドルウェアがバラバラというのは何となく運用側も辛い。障害があった時にマルチにすべてが判る人なんていないですしね。あと、不運だと思うけどハードトラブルに起因する障害が多いこと。保守の範囲内なら免罪符のような気もするけど、記事は厳しかった。米国のプラットフォーマたちに比べるとという一面もあるし、障害を起こしやすい型番だったという事実もあるらしい。儲かっていれば、確かにHDDよりSSDに切り替えた方が良いとは誰もが思うけど、儲からないシステムだし、莫大な開発費用を掛けていれば、HDDでいいんじゃないという判断も否定できない。色々課題は浮き彫りになっているけど、自分目線で見た時に、自分なら防げたと思えない事実が次々と出てくることにとても恐怖感を感じた。それに、金融庁はみずほの企業体質を上げていたけど、これも自分の会社は違うと言い切れないのが何とも。金融庁が「システム上、ガバナンス上の問題の真因」として挙げた4点は、そのまま自分の会社に当てはまるところが何とも言えない。一つ救われるのは、自社のシステムがみずほとは比べ物にならないくらいクリティカルなシステムではないこと。ただ、本当に止まったらそんなこと言っていられないんだろうな。ちょっとこの本は辛すぎる。

[DATA]

今月の読書 1冊

1月からの読書 10冊