表●みずほ銀行30の不手際
表●みずほ銀行30の不手際
[画像のクリックで拡大表示]

 みずほ銀行が3月に引き起こした大規模システム障害は、東日本大震災の義援金が引き起こした「天災」ではなく、明らかに「人災」だ。しかもシステム障害の原因は、現場の担当者の不手際といった人為ミスにあるのではなく、経営陣のITガバナンスの欠如にある。同行が5月に発表した調査報告書(pdf)が、そのことをはっきりと物語っている。

 日経コンピュータでは6月9日号で、みずほ銀行が第三者委員会「システム障害特別調査委員会」に依頼して作成した調査報告書を独自に読み解き、分析した。その結果、みずほ銀行のシステム障害は、30の「不手際」が積み重なることで長期化したことが分かった()。

 30の不手際の詳細は、日経コンピュータ6月9日号の「緊急特集」としてまとめたほか、同記事は6月13日から1週間に分けてITproにも転載する予定である。みずほ銀行のシステム部門が、多くの人為ミスを犯したのは事実だ。混乱のさなか、重要なデータを誤って削除してしまうというオペレーションミスも発生している。しかし現場の人為ミスだけでは、ここまで大規模なシステム障害にはならなかったと、我々は考えている。

15日分の異常終了は処理上限の設定ミスなしで生じた

 例えば、みずほ銀行の西堀利頭取が3月の記者会見で指摘していた「義援金口座に関する処理上限の設定ミス」(関連記事)がなくても、今回のシステム障害は起きていた。

 みずほ銀行のシステム障害は、同行の勘定系システム「STEPS」による夜間バッチ処理(預金元帳へのセンター集中記帳処理)が異常終了することで表面化した。夜間バッチの異常終了は、3月14日夜(14日分)と3月16日朝(15日分)の2回発生した。14日分の異常終了は、口座の処理上限を誤って小さくしていたことによって生じたが、15日分の異常終了は、処理上限の設定ミスなしに生じている。

 もう少し詳しく説明しよう。みずほ銀行のSTEPSに障害が発生した翌日の3月15日、ある携帯電話事業者が、携帯電話を使った振り込みサービスによる義援金を呼びかけた。その結果、同日の午後3時以降、同事業者の口座に振り込みが殺到。その日の夜間バッチにおいて、口座への振り込みデータを振り分ける(分割する)処理で上限値をオーバーし、夜間バッチが異常終了した。

 15日分の異常終了には、現場のミスは介在しない。STEPSがそもそも、携帯電話を使った振り込みサービスによる「振り込みの爆発」に耐えられるようになっていなかったことが、夜間バッチの異常終了を引き起こした。