정전으로 인한 11시간 동안 Blog Down


오늘(2011/06/10) 오전에 정전으로 인해 서버가 대략 40분 정도 down 했었는데요.


UPS가 연결된 상황이라 정전과 동시에 Server를 자동 종료 및 전원 복구에 따른 자동 실행 Log

처음에는 정전으로 인해 NAS서버에서 자동발송되는 경고 메일을 받고서야 정전이 난걸 알았답니다.

그때는 드디어 “언제쯤 도움이 될까?” 하던 UPS가 드디어 제값을 했구나하고 좋아했었는데…
이상하게도 정전이 발생한지 5시간이 지났는데도 정전 상황에서 벗어나지 못했는지 서버는 물론 Blog에 접속이 되지않는 문제가 발생됬답니다.

당시 사외 교육을 나간 상태고 집에는 사람이 없었을 때라 정확히 어떻게된 상황인지 알수가 없어 스마트폰으로 서버 접근을 시도해보니 이상하게도 VPN접속을 통한 공유기까지의 접속은 되는데 전원이 정상이라면 자동으로 켜져서 동작해야될 NAS 서버는 접근도 안되고 PC서버만이라도 어떻게 해보려고 WOL(Wake On Lan)을 이용해 PC서버 power on도 시도해보았지만 on되지 않는…
결국 정전형상 발생 이후 교육이 끝나 집으로 돌아가기까지 장차 11시간이라는 장시간 동안 블로그를 버려두는 상황을 맞이했답니다.T^T

어쨌든 집에 와서 확인해보니 WOL 문제는 공유기에 SW 에러가 있었는지 공유기를 Reset 한번 하고 나니 제대로 동작하고, Blog는 웹서버가 문제가 아니라 하루 전날 진행한 NAS 장비 펌웨어 업데이트가 crontab에 등록 시켜두었던 다이나믹DNS업데이트 실행 스크립트를 날려버리는 바람에 도메인과 서버 ip 주소가 맞지 않아 발생하던 문제였더군요.

생각해보면… 집에서는 5분만에 해결할 간단한 문제이기도 했지만 야외에서도 조금만 신경 썼으면 충분히 해결할 수 있을 문제였던거 같습니다. 그래서 앞으로는 이런 문제가 발생하면 빠르게 해결 할 수 있게  Check Plan을 세워두었긴 했는데 나중에 재대로 대응 되려나 모르겠습니다. : )