대한민국 총 데이터센터 수는 2024년 기준으로 총 165개소가 운영되고 있으며, 2020년부터 꾸준히 증가(2020년~2024년 연평균 1.41% 성장률)하는 추세이고 민간 데이터센터의 총 매출액 규모도 크게 성장하고 있다.
최근 국정자원정보센터 화재로 인해 데이터센터 운영과 안전에 대해 관심이 집중되고 있어 데이터 센터 운영현황과, 운영상 문제점, 개선대책 중심으로 알아보고자 한다.
1. 우리나라 데이터 센터 운영현황
데이터센터의 약 60.4%가 서울, 경기 등 수도권에 집중되어 있어 지역 간 편중 현상이 뚜렷하다. 수도권 내에서도 성남, 안산, 일산, 가산, 상암, 평촌, 용인 등이 주요 권역으로 파악된다.
카카오 데이터센터 안산 전산동 2층 배터리실 (사진=카카오)
수도권 집중으로 인한 전력 문제와 규제 등으로 인해, 동해, 강릉, 호남(서남권), 호서(중부권), 영남 등 비수도권 지역으로 데이터센터를 분산하려는 계획이나 움직임도 있다.
2024년 기준으로 국내 데이터센터 시장의 총 수전 용량은 1.9 기가와트(GW)를 기록했으며, 2028년까지 약 4.8 GW 규모로 성장할 것으로 전망하고 수도권 데이터센터 용량은 2028년까지 4.1 GW로 확대될 것으로 예측된다.
AI 확산, 클라우드 컴퓨팅, 5G, IoT 등의 기술 발전으로 데이터 처리 및 저장 수요가 급증하면서 국내 데이터센터 시장은 앞으로도 활발하게 성장할 것으로 예상된다.
데이터센터의 수도권 집중과 급증하는 전력 수요로 인해 전력 공급의 어려움과 정부의 규제 및 정책이 향후 데이터센터 개발의 주요 과제가 될 것으로 보인다.
데이터센터는 과도한 전력 사용 및 발열 문제로 인해 ESG 측면의 우려도 커지고 있어, 에너지 효율화와 친환경적인 운영이 중요해지고 있다.
2. 데이터센터 운영상 문제점
데이터센터는 24시간 365일 운영되어야 하는 핵심 인프라이기 때문에, 화재와 같은 물리적 재난뿐만 아니라 다양한 운영상의 위험 요소에 취약할 수 있다. 특히 최근 국정자원정보센터 화재, 카카오데이터센터에서 문제가 된 요인들을 포함하여 데이터센터의 주요 위험 요인은 다음과 같다.
데이터센터 화재의 가장 큰 원인 중 하나는 전력 공급 시스템과 관련된 문제이다.
UPS에 사용되는 리튬이온 배터리는 높은 에너지 밀도로 인해 한 번 불이 붙으면 진압이 매우 어렵고 재발화 위험이 크다.
서버실과 화재 위험이 높은 배터리(UPS) 설비를 같은 공간에 두거나, 좁은 간격으로 배치할 경우 화재 발생 시 서버 장비로의 확산 및 진압을 어렵게 만다. 이는 국정자원 사례의 주요 문제로 지적되고 있다.
특이 이번 사고처럼 배터리 이동이나 교체 등의 작업 중 부주의 또는 외부 충격으로 인한 단락(쇼트) 발생으로 화재가 일어날 수 있다.
또한 다량의 전기 배선이 뭉쳐 있으면 과도한 열이 발생하여 화재를 유발할 수 있다. 그리고 누전, 접촉 불량 등 전기적 결함으로 인한 발화가능성이 있다.
물리적 시설 결함 외에 시스템 운영 관리의 미흡함이 대형 사고로 이어질 수 있다. 재난 발생 시 다른 지역의 백업 센터(광통신망, 클라우드 복제 등)로 시스템이 자동으로 전환(Failover)되어야 하지만, 이것이 제대로 작동하지 않거나 이중화 수준이 미흡할 경우 서비스 마비가 장기화된다. 카카오 판교 데이터센터 및 국정자원정보센터 사례에서 대규모 서비스 중단의 주요 원인이 이중화작업이 이루어지지 않았기 때문이다.
그리고 백업 시스템이 실제로 작동하는지 주기적인 테스트를 하지 않거나 훈련이 되어 있지 않아서 실제 상황에서 실패하는 경우가 종종 발생한다.
또한 구조적 설계 문제으로는 노후화된 시설도 지적된다. 옛 건물이나 구조적 설계가 데이터센터 기준에 맞지 않는 건물을 개조하여 사용할 경우, 화재 위험 시설(배터리 등)의 분리 설치가 어려워 위험이 높아진다.
3. 데이터센터 개선방향
우리나라 데이터센터 구축 운영방안에 대하여 이야기하고자 한다.
4차 산업혁명 시대의 데이터센터는 AI, IoT, 클라우드 등 모든 디지털 혁신의 기반 시설이다. 국정자원정보센터와 같은 화재 사고를 교훈 삼아, 서비스 연속성과 데이터 안전성을 극대화하기 위한 안전한 데이터센터 운영 방안은 다각도로 추진되어야 한다.
재난 복원력 및 서비스 연속성 강화(Resilience)를 위해 단일 장애가 전체 서비스 마비로 이어지는 것을 방지하는 것이 핵심이다.
이를 위해 완벽한 이중화 및 다중화 체계 구축(Multi-Region/Multi-Cloud)를 구축해야 한다.
지리적 분산 (Triple-Site): 데이터와 시스템을 최소 3곳 이상의 지리적으로 분산된 데이터센터에 보관 및 실시간 동기화한다. 이는 화재뿐만 아니라 지역적 광역 재해(지진, 광역 정전 등)에 대비하는 가장 강력한 방법이다.
재해 복구 시스템(DR)을 단순히 '대기 상태(스탠바이)'로 두지 않고, 평상시에도 두 개 이상의 센터가 동시에 운영되는 '액티브-액티브(Active-Active)' 체계를 구축하여, 한쪽 센터가 멈추면 즉시 다른 쪽이 서비스를 이어받도록 해야 한다.
특정 클라우드 서비스 사업자(CSP)에 종속되지 않고, 여러 CSP의 인프라를 동시에 활용하여 한 곳의 장애가 전체 서비스에 영향을 미치지 않도록 멀티 클라우드 전략이 필요하다.
신속한 복구 목표 RTO (Recovery Time Objective) 서비스 복구 목표 시간을 최소화해야 한다. 핵심 업무의 경우 수분 이내의 복구 시간을 목표로 설정하고, 이에 맞춰 인프라와 자동 절체 시스템을 정교하게 구성한다.
복구 시점 목표(RPO Recovery Point Objective) 설정도 필요하다. 재해 발생 시 손실되는 데이터의 허용 범위를 '실시간(Zero Loss)'에 가깝게 설정하고, 실시간 동기화 기술(Sync/Async 복제)을 적용해야 한다.
주기적인 재난 복구(DR) 모의 훈련을 정기적으로 실시하고 데이터센터에서는 모의훈련을 의무화해야 한다. 백업 시스템의 실효성을 확보하기 위해 실제 서비스 중단과 같은 상황을 가정한 복구 훈련을 정기적으로 실시하고, 결과를 의무적으로 공표해야 한다.
다음은 화재 등 물리적 재난의 근본적인 위험 요소를 제거해야 하는 방법에 대하여 이야기하고자 한다.
배터리 등 위험 시설의 완벽한 분리 및 전용 공간 확보가 필요하다.
UPS 및 배터리 독립 시설화: 화재에 매우 취약한 리튬이온 배터리를 서버실과 완벽하게 구획된 별도의 건물, 지하 공간 또는 옥외에 독립적으로 설치하고, 내화 구조로 분리해야 한다.
배터리 전용 소화 설비 의무화: 리튬이온 배터리 화재의 특성(재발화, 열폭주)에 대응하기 위해 전용 냉각 및 소화 시스템을 의무적으로 설치해야 한다.
지능형 감시 및 예지 보전(Predictive Maintenance) 시스템 도입이 필요하다.
AI 기반 위험 감지 시스템을 활용하여 네트워크 트래픽 이상 징후, 장비의 미세한 온도 변화, 진동 등 하드웨어 장애의 조기 경고 신호를 실시간으로 탐지하고 예측하여 사고 전에 선제적으로 대응한다.
컴퓨터 비전(Computer Vision) 활용하여 카메라와 센서로 무단 침입, 연기 발생, 작업자의 안전 수칙 위반 등을 실시간으로 감시하고 즉시 경고하는 시스템이 필요하다.
데이터센터 사고를 예방하기 위해 설계 단계부터 안전 및 효율성이 확보되어야 한다.
친환경·고집적 데이터센터를 위한 냉각 기술(액체 냉각 등)을 적극 도입하여 전력 효율을 높이고 과열 위험을 최소화한다. 효율적인 케이블 관리를 통해 과열 및 화재 위험을 줄이고 유지보수 편의성을 높일 수 있다.
안전한 운영을 위한 제도적 기반을 마련해야하기 위해 . 정부는 법·제도 및 관리 체계의 정비 에 박차를 기해야 한다.
데이터센터 용도 및 관리 기준을 법제화해야 한다. 데이터센터를 건축법상 별도 용도로 지정하여 친환경·고집적화된 시설 구축을 용이하게 하여 민간기업의 자발적인 투자를 유도할 수 있다.
국가 중요시설 데이터센터에 대한 정기적인 소방 안전 점검을 의무화하고, '보안'을 이유로 핵심 구역에 대한 점검을 회피하지 않도록 안전점검 및 관리 체계를 강화하도록 법률개선이 필요하다.
이러한 제도 정착과 투자 유치를 위해서 정부는 데이터센터 규제 완화와 인센티브 제공이 필요하다.
데이터센터 운영 비용의 핵심인 전기 요금 특례 제도 재도입 및 에너지·환경 규제(온실가스 감축)에 대해 데이터센터의 특성을 반영한 유연한 기준을 마련하여, 사업자의 경영 부담을 완화하고 안전분야 투자를 유도해야 한다.
그리고 수도권 집중 문제를 해소하기 위해 비수도권 데이터센터 구축 시 전력 공급 인프라 구축 지원, 세제 혜택 등 실질적인 인센티브가 필요하다.
이번 데이터센터 화재로 인한 직간접적인 피해가 얼마나 큰지 국민 모두가 실감했다.
향후 이러한 실질적 문제점을 해결하지 못하면, 4차 산업혁명 시대의 핵심 인프라가 마비될 것이라고 예측한다. 이는 곧 우리나라의 디지털 경쟁력 상실과 경제적 도태를 의미한다. 미래를 선도하려면, 안전한 데이터 환경 구축은 더 이상 선택이 아닌 생존 전략인 것을 명심햐야 할 것이다.
기고 김효범 : 한국화재감식연구소장, 한국화재폭발조사협회 부회장