생성형 AI의 시대가 도래했다. 챗GPT(ChatGPT)가 쏘아 올린 공은 전 세계적인 AI 인프라 경쟁을 촉발했고, 엔비디아(NVIDIA)의 GPU는 없어서 못 파는 지경에 이르렀다. 하지만 이 눈부신 디지털 혁명의 이면에는 물리적인 공포가 도사리고 있다. 바로 ‘데이터센터 화재’라는 시한폭탄이다.
지난 2022년 판교 SK C&C 데이터센터 화재는 ‘국민 메신저’ 카카오톡을 멈추게 하며 디지털 재난의 파괴력을 실감케 했고 올해 대전 정부 데이터센터 화재는 국민 민원서비스 뿐만아니라 정부기관 전산망을 완전히 멈우게 했다. 그러나 전문가들은 “앞으로 닥칠 AI 데이터센터의 화재는 판교 사태, 대전전산센터 화재와는 차원이 다른 양상을 보일 것”이라고 경고한다. 과연 AI 데이터센터의 증가는 어떠한 형태의 재난으로 우리를 위협할 것인가?
데이터센터열밀도의 공포 ‘용광로’가 되고 있다.
과거의 데이터센터가 단순한 데이터 저장소(Storage)였다면, AI 데이터센터는 거대한 계산기(Computing)다. 구글과 마이크로소프트의 최신 연구 논문에 따르면, AI 학습을 위한 랙(Rack) 당 전력 소비량은 과거 5kW 수준에서 최근 50kW를 넘어 100kW를 향해 치닫고 있다.
이것이 의미하는 바는 명확하다. 바로 ‘열(Heat)’이다. 좁은 공간에 수천 개의 고성능 GPU가 24시간 100% 가동률로 돌아가며 뿜어내는 열기는 상상을 초월한다. 기존의 공기 냉각(Air Cooling) 방식으로는 한계에 봉착했고, 냉각 시스템이 단 5분만 멈춰도 서버실 온도는 순식간에 50도를 넘어 반도체를 녹일 수 있는 수준에 도달한다.
열화상 카메라로 촬영한 고밀도 서버 랙의 모습. 냉각 효율이 떨어진 국소 부위(Hot Spot)가 붉은색으로 표시되며 위험 수위에 도달했음을 보여준다.
이러한 고열 환경은 전선 피복을 경화시키고, 아주 작은 전기적 스파크 하나도 거대한 화마로 키우는 최적의 조건이 된다.
리튬이온 배터리: NFPA 855가 경고하는 ‘꺼지지 않는 불꽃’
AI 데이터센터는 막대한 전력을 소비하므로, 정전 시 이를 지탱할 에너지저장장치(ESS)와 무정전전원장치(UPS)의 규모 또한 비대해질 수밖에 없다. 문제는 이들이 대부분 리튬이온 배터리를 기반으로 한다는 점이다.
미국 방재협회의 NFPA 855(고정식 에너지 저장 장치 설치 기준)에서는 리튬이온 배터리의 위험성을 감안하여 배터리 랙 간의 이격 거리와 최대 용량 제한을 엄격히 규정하고 있다. 하지만 현실의 수요는 이 기준을 위협할 만큼 빠르게 증가하고 있다.
유튜브 등에 공개된 수많은 배터리 화재 실험 영상들은 충격적이다. 배터리 셀 하나가 손상되어 내부 온도가 상승하면, 순식간에 옆 셀로 열이 전이되며 연쇄 폭발을 일으키는 ‘열폭주(Thermal Runaway)’ 현상이 발생한다.
더욱 절망적인 것은 이 화재가 산소를 자체적으로 생성한다는 점이다. 아무리 하론 가스를 뿌리고 이산화탄소를 덮어도, 배터리 내부는 스스로 산소를 만들어내며 물속에서도 불타오른다. 이는 기존 소방 전술을 무력화시킨다.
숨겨진 복병: 고전압 직류(HVDC)와 ‘누설전류’의 역습
전력 효율성을 위해 데이터센터들이 교류(AC) 대신 고전압 직류(DC) 배전 방식을 채택하는 추세 또한 새로운 위험요소다. 여기서 주목해야 할 것은 바로 ‘누설전류(Leakage Current)’다.
IEEE(전기전자공학자협회)**의 데이터센터 접지 관련 논문들에 따르면, 고전압 DC 환경에서는 절연체 표면의 오염이나 미세한 손상으로 인해 발생하는 누설전류가 지속적인 ‘DC 아크(Arc)’를 유발할 가능성이 높다고 지적한다. 교류(AC)는 전압이 0이 되는 지점(Zero-crossing)이 있어 아크가 자연 소멸할 기회가 있지만, 직류는 전압이 일정하게 유지되므로 아크가 끊어지지 않고 지속적으로 주변을 태우며 온도를 수천 도까지 올린다.
특히 최근 도입이 늘고 있는 ‘액침 냉각(Immersion Cooling)’ 방식(서버를 비전도성 특수 용액에 담그는 방식)에서도 용액의 오염이나 성분 변화로 인해 절연 성능이 떨어질 경우, 누설전류로 인한 전기화학적 부식과 화재 확산은 전례 없는 유형의 사고를 만들어낼 것이다. 이는 단순한 누전 차단기로는 감지조차 어려운 ‘스텔스 화재’의 원인이 된다.
독성 가스와의 전쟁: 데이터 손실 그 이상의 피해
미국 UL(Underwriters Laboratories)의 연구 보고서에 따르면, 데이터센터 화재 시 발생하는 연기는 플라스틱 케이블, 반도체 기판, 배터리 전해액이 타면서 발생하는 불화수소(HF), 염화수소(HCl) 등 맹독성 가스의 집합체다. AI 데이터센터가 응답 속도를 높이기 위해 도심지 인근(엣지 데이터센터)으로 들어오는 추세를 고려할 때, 화재 시 방출되는 독성 가스는 인근 주민의 생명을 직접적으로 위협하는 화학 재난으로 이어질 수 있다.
데이터센터 화재 ‘설마’를 버리고 ‘최악’을 대비할때
우리는 지금 인류 역사상 가장 뜨겁고, 가장 전기를 많이 먹는 시설물을 짓고 있다. 따라서 방재 대책 또한 과거의 기준을 완전히 뜯어고쳐야 한다.
데이터센터 화재를 예방하기 위해 물리적 격리를 강화해야 한다. NFPA 855 기준을 국내 실정에 맞게 더욱 강화하여 UPS와 ESS실을 서버실과 물리적으로 완전히 분리하고, 격벽의 내화 성능을 획기적으로 높여야 한다.
데이터센터에 대한 누설전류 감시 체계 도입이필요하다. IEEE 권고안을 바탕으로 직류 전원 시스템에 특화된 정밀 누설전류 감지 장치와 아크 차단기(AFCI) 도입을 의무화해야 한다.
아이러니하게도 화재를 막는 것 역시 AI를 활용한 예지 보전방법이 가장 효과적일 것으로생각한다. AI를 통해 배터리의 미세한 전압 변화와 서버실 내의 열화상 데이터를 실시간으로 분석, 누설전류나 열폭주의 징후를 ‘발화 10분 전’에 감지해내는 시스템이 필수적이다. 이에대한 R&D가 활발하게진행되어야 할 것이다.
대한민국은 IT 강국이지만 안전의 강국이라 스스로 말할 수 있는가? 안전이 담보되지 않는 기술의 속도는 재앙일 뿐이다. 제2의 카카오 사태, 대전정보전산센터 사태, 아니 그보다 더 끔찍한 AI 데이터센터의 대형 참사를 막기 위해, 정부와 기업은 지금 당장 ‘안전의 비용’을 아끼지 말아야 할 것이다. 화려한 인공지능의 미래가 잿더미 위에서 시작될 수는 없기 때문이다.
김효범 한국화재감식연구소장, 한국화재감식학회 이사