Monthly Archives: February 2012

Korban Murphy's Law

Beberapa waktu yang lalu, saya membuatkan infrastruktur IT untuk sebuah client yang serba redundant & resilient. Semua server ada hot-standby nya. Database server ada replikanya. Redundant UPS & AC. Lalu, untuk ISP nya, saya pilih yang multiple backbone. Sehingga, kalau salah satu backbone nya down, traffic masih bisa lancar via 2 backbone lainnya. Cukup? Ternyata, ada yang terlewat oleh saya….

3 backbone ISP tersebut semuanya melalui 1 (satu) Master Router.
Bisa tebak apa yang terjadi kemudian ? :-/

Yup, seperti yang telah dinyatakan pada Murphy's Law :
"Whatever can go wrong will go wrong, and at the worst possible time, in the worst possible way"

Master Router tersebut tewas – pada saat peak hours :<

Terjadilah kehebohan yang luar biasa, karena infrastrukturnya down pada saat sedang sibuk-sibuknya digunakan = semua orang tahu, dan semua orang jadi korbannya. Akhirnya saya sendiri juga ikut begadang sampai hampir pagi untuk mengawasi semua proses recovery jaringannya.

Lessons learned; Ada yang tahu ISP yang infrastrukturnya benar-benar redundant juga? Supaya jangan menjadi SPOF (single point of failure) dari infrastruktur kami ini.

Terimakasih.

Post imported by Google+Blog for WordPress.