카카오 "판교가 메인 센터…서버 3만2천대 중 1만2천대 복구" | 연합뉴스
"매뉴얼은 20분 내 복구지만 서버 손실량 워낙 커"
"카카오 서비스 완전 복구까지는 얼마나 더 걸릴지 말하기 어렵다
(생략)
양 부사장은 이날 화재 현장에서 기자들과 만나 "이곳에 서버를 약 3만2천 대 정도 두면서 메인 데이터센터로 삼았다"면서 "현재 1만2천 개 정도의 서버가 복구된 상황"이라고 말했다.
그는 "본래 20분 내 복구가 매뉴얼이지만, 서버 손실량이 워낙에 크다"면서 카카오톡 등 서비스가 완전히 복구되기까지 시간이 얼마나 더 걸릴지 정확히 말하기는 어렵다고 전했다.
이어 그는 "전체 전원 공급이 차단된 상태여서 이중화 조치에도 트래픽을 전환하는 데 많은 시간이 걸리고 있다"고 설명했다. 이중화 조치는 같은 데이터를 여러 곳에 복제해두는 행위를 뜻한다.
그러면서 그는 "서버 3만2천 대가 전부 다운되는 것은 IT 업계에서 유례를 찾기 어려운 상황"이라며 대처하는 데 어려움이 있다고 덧붙였다.
(생략)
카카오 "메인 데이터센터 화재로 서버 대량 유실…약 40% 복구" (news1.kr)
(생략)
그러면서 "전원 공급이 이뤄지게 될 경우 추가적으로 서버 재개가 가능할 것"이라고 말했다.
양 부사장은 "화재 현장이었기 때문에 진입이 어려운 점이 있어 시간이 조금 더 지연되고 있다"며 이용자분들의 서비스에 불편을 끼쳐드린 점에 대해 진심으로 사죄한다"고 부연했다.
(생략)
실 서버 * 복제 갯수로 보시면..
유례를 찾을 수 없다는 변명도 말이 안 되는 것이 DC 내 UPS나 비상발전기 쪽에서 화재가 일어나서 수 시간 이상, 길게는 1일 이상 서버 복구가 안 되는 경우는 역사상 유례가 없던 일도 아니고 종종 일어나는 일입니다.
실제로 최근 (몇 달 전) 아이오와에 있는 구글 DC에서 디젤 비상용 발전기가 폭발하여 해당 발전기실 라인에 있는 머신들이 장시간 다운되는 바람에 검색 등 서비스가 수 분간 장애를 겪은 사례가 있고요.
3만대 정도의 서버가 무시할 수 없는 비중을 가진 회사가 DC 한 곳에 3만대를 다 몰빵했다가 터뜨려놓고 복구를 못하고 있다면 그건 완전한 자업자득이죠.
변명거리가 안되는거 같은데
요
매뉴얼이 20분인데
복구 시간 갭이 너무한거 아닙니까?ㅋㅋ
이걸 변명으로 쓰나요?
/samsung family out
3만대중에 한 2% 정도는 (내맘대로 예상) 는 부팅 파티션이나 파일시스템 깨져서 부팅이 안 될 겁니다.
그건 일일히 사람이 몇시간씩 들여 복구해야죠. 3만대중 2% 정도 잡으면 600대도 넘죠.
전원 넣는거야 금방 하지만, 결국 복구하고 확인할 사람이 모자라서 오래 걸릴 수 밖에 없다능.
프로세스 단위로 말이죠;
실제 물리적 서버 장비 대수로는 몇대가 될런지요…
그리고 다 떠나서.. 저 많은걸 한곳에 다 몰았다라….
일단 저곳에만 미사일 하나만 떨궈도 전국민 소통 마비 되겠군요.
범죄로도 악용될수도 있겠고요. 정보 수집 착실히 하고 있을지도요..
그걸 왜 일일이 세나요;;; 내부적으로 문서화 다 되어 있을테고, 총 프로세스로 동작되는 서버 개수까지 기본적으로 알고 있어야죠
저희 회사가 저런 상황 발생됐다고 생각하면 아찔합니다
그나마 말 나올수있는건 dr이겠지만 이번 일을 계기로 이게 얼마나 강제화하게 될지 모르겠네요