TKYTEL COMMENT 21 百合子設計局 局長 市川ゆり子 2025-12-14 ちゃんとするの濫用について (TKYTEL COMMENT 13 へのアンサーソング) (TKYTEL COMMENT 18 のつづき) 1. 概要 人間は「ちゃんと」できない。「うっかり」するのが人間である。 2. 経緯 [TC13] を見てたら黙っていられなくなった。 3. 想定されるリスク 「ちゃんと」できなかったことによる、障害の頻出。 4. 処置 人間の「うっかり」に対しては「ちゃんとする」ではなく仕組みを持って あたる。 5. 対策 怪しいメッセージを見落とすことなど、商用環境運用においては容易に起 きうることなので、見落とさないこと(人間の注意力に頼ること)を心がけ るのではなく、見落としても大丈夫な仕組みや切り戻し手順、容易に切り戻 し可能な仕組みを整備する。 極論、飲酒したまま作業しても問題ないような仕組みにする。(商用作業 だと飲酒 SE は論外だが、まぁここは趣味で組んでいる環境なので) 対策の具体例としてはディスクを 2 枚用意し、古いディスクから新しい ディスクにデータをコピー、新しいディスクにアップデートを当てる。こう すると、古いディスクを刺し直すだけで切り戻しが完了する。(百合子設計 局でよくやる手順)仮想環境ならスナップショットを取っておく方法でもよ い。 また仮想化基盤や Docker ホストに何でもかんでも載せておくと、基盤障 害時に上に乗っかっている環境全てに影響が及ぶので、より慎重な作業計画 や切り戻し手順の整備に励みつつ、環境の分散化も視野に入れたいところ。 (たまごを 1 つのカゴに盛るなの格言どおり) 6. まとめ ちゃんとしよう!(コラ 障害は起こしてもいい。ただ、振り返りは “ちゃんと” しよう。 7. 参照 [TC13]: はくさい局. “障害報告書: 仮想基盤システム プログラム交換失 敗に伴う不通”. TKYTEL COMMENT 13. 以上