데이터센터는 현대 디지털 사회의 핵심 인프라이자 신경망이다. 이곳에서 발생하는 화재는 단순한 시설물 피해를 넘어 국가 경제와 국민 생활에 심각한 마비와 혼란을 초래하며, 이는 더 이상 간과할 수 없는 디지털 재난으로 인식되어야 한다. 최근 국내외에서 발생한 주요 데이터센터 화재 사례들은 우리가 간과했던 잠재적 취약점들을 명확히 드러내고 있다.
1. 세계 주요 데이터센터 화재 사례를 통해 문제점과 취약점
2025년 국가정보자원관리원(국정자원) 화재 사고 (대한민국)
2025년 9월 26일, 대전광역시에 위치한 국가정보자원관리원 본원의 전산실에서 대규모 화재가 발생했다. 이 사고는 무정전 전원 장치(UPS) 리튬이온 배터리의 폭발이 원인으로 지목되었으며, 배터리 이전을 위한 사전 작업 중 발생한 인적 오류가 결합된 인재였다.
화재로 인해 전산실 배터리 팩 총 384개가 모두 소실되었으며, 정부 전자시스템 96개를 포함한 총 709개의 정부 업무 시스템이 장시간 가동 중단되는 국가적 혼란을 야기했다. 정부24, 온나라 서비스, 119 긴급출동 신고 시스템 등 핵심 서비스가 마비되었고, 시스템 및 데이터 소실 피해액은 최소 95억 원을 상회하는 것으로 예상되었으나 국민들의 간접적인 피해는 금액으로 산정하기 어려운 실정이다. 이 사고는 국가 공공데이터 관리 시스템의 이중화 미흡과 인적 관리의 중요성을 부각시켰다.
2022년 SK C&C 판교 데이터센터 화재 (대한민국)
2022년 10월 15일, 경기도 성남시의 SK C&C 판교 데이터센터에서 발생했다. 지하 배터리실에서 시작된 화재는 건물 전체의 전원 공급을 차단시켰고, 입주해 있던 카카오톡, 네이버 등 주요 인터넷 서비스가 장시간 마비되는 초유의 사태를 낳았다.
시설 피해뿐 아니라, 카카오 플랫폼을 이용하는 소상공인의 영업 손실과 국민의 일상생활에 막대한 불편을 주어 사회·경제적 피해액이 수천억 원에 달할 것으로 추산되었다. 이 사건은 데이터센터 내 전원 시스템의 이중화 실패와 지리적 이중화(DR)의 부재가 얼마나 큰 국가적 재난으로 이어질 수 있는지 경고했다.
2021년 OVHcloud 스트라스부르 데이터센터 화재 (프랑스)
2021년 3월 10일, 프랑스 스트라스부르에 위치한 OVHcloud의 데이터센터 건물 중 SBG2 건물이 완전히 전소되는 대형 화재가 발생했다.
화재로 수천 대의 서버가 파괴되었고, 수십만 개의 웹사이트와 수만 개 고객의 데이터가 복구 불가능한 상태로 영구 손실되었다. 정확한 총 재산 피해액은 비공개지만, 파괴된 서버와 데이터의 가치를 고려하면 수천억의 막대한 규모였다. 이 사고는 백업 및 재해 복구(DR) 전략에서 물리적 건물 분리의 중요성을 전 세계에 일깨웠다.
2020년 IBM 왈러스 그로브(Hursley) 데이터센터 화재 (영국)
2020년, 영국 왈러스 그로브에 위치한 IBM 데이터센터에서 화재가 발생했다. 원인은 UPS(무정전 전원 공급 장치) 배터리 시스템의 고장에서 비롯된 것으로 추정된다.
재산 피해 및 영향: 이 화재로 인해 영국의 주요 금융 및 은행 서비스의 일부 운영이 중단되거나 영향을 받았다. 정확한 재산 피해액은 공개되지 않았으나, 금융 서비스 중단으로 인한 경제적 손실은 상당했을 것으로 예상된다. 이 사례는 전력 시스템 관리의 중요성과 초기 진압 설비의 필요성이 간과될 경우, 핵심 비즈니스 서비스가 얼마나 쉽게 마비될 수 있는지 보여주었다.
2014년 AWS 북버지니아 데이터센터 화재 (미국)
2014년, 아마존 웹 서비스(AWS)의 북버지니아 리전 데이터센터에서 화재가 발생했다. 원인은 단일 서버 랙(Rack) 내부에서 시작된 것으로 파악되었다.
화재는 서버에서 발생했으나, AWS의 광범위한 분산 클라우드 아키텍처 덕분에 피해는 특정 고객 및 서비스로 한정되었고, 전체 서비스 마비는 피할 수 있었다. 이 사고의 직접적인 재산 피해 규모는 상대적으로 제한적이었지만, 클라우드 서비스가 장애 격리(Fault Isolation) 설계와 가용 영역(Availability Zone) 간의 완벽한 분산이 필수임을 입증한 사례로 평가받았다.
2. 데이터센터 화재가 드러낸 근본적 문제점과 대책
위의 사례들을 통해 데이터센터 화재를 키우는 몇 가지 공통적인 문제점들이 드러났다.
전력 및 배터리 시스템의 구조적 취약성: 화재의 가장 잦은 원인은 리튬 이온 배터리가 사용되는 UPS 및 ESS 구역이다. 이 구역은 열 폭주 위험이 높음에도 불구하고, 서버실과 물리적으로 완전히 분리되지 않거나 특수 소화 시스템이 미비한 경우가 많아 화재 시 초기 진압이 어렵고 피해가 급격히 확산된다.
진정한 의미의 '이중화' 부재: 판교 및 국정자원 사례처럼, 이중화가 건물 내부에서만 이루어져 건물 전체 정전이나 화재 발생 시 모든 이중화 장치가 무력화되는 '단일 장애 지점(Single Point of Failure)' 문제가 반복되었다. 지리적으로 멀리 떨어진 데이터센터 간의 실시간 백업 및 전환 체계가 미흡했다.
초기 화재 감지 및 진압 시스템의 실패: 화재 발생 후 초동 대응 골든타임을 놓치면서 피해가 확대된다. 데이터센터 환경에 적합한 미세 연기 감지 시스템과 배터리 화재용 소화 약제 등 특화된 설비의 노후화나 부적절한 관리가 문제로 지적된다.
인적 오류 및 관리 소홀: 국정자원 사례에서 보듯이, 시스템 운영 및 정비 과정에서의 인적 오류가 대형 화재의 결정적인 원인이 되기도 하다. 이는 안전 시스템에 대한 운영 인력의 전문성과 재난 대응 훈련의 부족으로 이어진다.
데이터센터 화재는 이제 '해당 기업'만의 책임이 아닌, '국가적 재난 대비'의 영역으로 격상되어야 하다. 정부와 기업은 이번 국내외의 뼈아픈 교훈을 바탕으로, 배터리실 분리 의무화, 지리적 DR 체계 법제화, 운영 인력의 전문성 강화 등 전면적인 안전 시스템 재정비에 나서야 할 때이다.
3. 결론 및 주요 대책
데이터센터 화재는 디지털 사회의 지속 가능성을 위협하는 국가적 재난이다. 위의 사례들을 교훈 삼아 다음의 대책이 시급히 마련되어야 한다.
데이터센터 내 UPS 및 ESS 등 배터리 시설을 서버실과 완전히 분리하고, 불연재 사용 및 전용 화재 진압 시스템(예: 배터리 화재용 소화 시스템)을 의무화해야 한다.
정보서비스에 대해 지리적으로 멀리 떨어진 복수 데이터센터 간의 실시간 이중화를 법제화하고, 장애 발생 시 자동 서비스 전환이 가능한 체계를 구축해야 한다.
데이터센터 운영 인력에 대한 정기적인 전문 교육 및 재난 대응 훈련을 의무화하고, 정부 차원에서 안전 시스템에 대한 합동 점검을 강화해야 한다.
마지막으로 데이터센터 화재가 배터리, UPS 시설 등 특정 전력 설비에서 주로 발생하는 만큼, 화재 감식 전문가들의 화재 예방 기술 연구와 위험성 평가 활동이 절실히 필요하다.
기고 김효범 : 한국화재감식연구소장, 한국화재폭발조사협회 부회장