
今週は、初日から最悪の展開。
俺の管理しているサーバーでとんでもないミスが発覚!!
原因は前日の深夜に俺が動かしていた、メンテナンス用のプログラムのせいということも判明した。
なんでこんなことになったかというと、本当はデバッグ用のサーバで動かすようにプログラムの実行先を設定したつもりがその設定変更がうまくいっておらず。
本格運用をしているデータベース側で動かしてしまったため、発生してしまった。
とんでもない自体となり、ラインの生産・出荷が一時ストップするくらいの事態となってしまった。
結局、なんとか使えるレベルにまで復旧したもののデータの欠損があるので残業で直すことに。
しかしこれまた大量のデータを扱うサーバのためにデータ移動だけでも数時間。
しかもそれが失敗しているとなると、またやり直し・・・・。
その結果、残業はどんどん伸びていき、とうとう次の日の朝までかかって結局は復旧できず。
【スポンサード リンク】
最悪や・・・・・。
というか、俺はともかくそのサーバ本体を管理している同僚や、一緒に残ってくれていた上司の方に申し訳ない。
自分のせいなんですけど、自分だけで直せないし・・・というのは自分のスキル不足のため。
朝までいたので、いったんみんな朝から昼まで休暇をとり、その日も残業でチャレンジ。
残業時間、途中までうまくいっていたものの仮環境のPCが突然WindowsUpdateが走り始めてストップしてしまった。
これにより、この日も結局は復旧できずにあきらめることに。
今週末、すべてのデータベースをクリアして作り直すことに決めてその日は日付が変わるくらいに解散となった。
データベースの管理って一歩間違うととんでもないことになるからこそ、最初にデバッグ環境用にプログラムを直したつもりが・・・・。
最後に動かすときに、本当にそのデバッグサーバに向けてプログラムが走っているかの確認を怠ったために、こんなとんでもないことになってしまった。
反省しきりではあるけど、起こってしまったことは仕方ないので復旧に全力をつくすのみ。