최근 국가정보자원관리원(NCIA) 화재 및 전산망 마비 사태는 단순한 기술적 사고를 넘어, 정부의 위기 관리 능력과 시스템 안전 투자의 실패를 여과 없이 보여준 중대한 사건이다. 이 사건을 통해 드러난 정부의 대책 부재는 구체적인 데이터와 사례를 통해 더욱 명확히 지적되어야 한다.

데이터센터 화재 ChatGPT_Image


이번 사태에서 정부의 초기 상황 파악과 대비 수준이 얼마나 미흡했는지 수치로 확인된다.

중단된 시스템 개수도 647개에서 709개로 피해 규모를 초기에도 정확히 파악하지 못한 것이 드러났다.

지속적인 복구 노력에도 불구하고 복구율이 며칠간 매우 더딘것으로 나타났다. 핵심 서비스 복구 지연핵심 시스템에 대한 백업 및 재해복구(DR) 체계가 사실상 미비했음을 방증한다.

마비된 주요 서비스는 정부24, 복지로, 교육행정정보시스템(나이스) 등 국민 생활 및 행정 서비스의 근간이 마비되어 사회적 혼란 야기했다.

정부는 핵심 시스템에 대해 원격지에 백업 서버를 구축하는 이중화(Disaster Recovery, DR) 체계를 갖추고 있다고 밝혀왔다. 그러나 이번 화재로 수많은 시스템의 복구가 지연되었다는 것은, 다음 중 하나 또는 복합적인 문제가 있었음을 시사한다.

예산 절감 등을 이유로 핵심 기능만 제한적으로 DR 시스템을 구축했거나, 데이터 연동(Replication)에 문제가 있었던 것으로 보인다.

평상시 DR 시스템으로 전환하는 모의훈련이 형식적이어서 실제 재해 상황에서 작동에 실패했다.

중요 서비스의 경우 몇 시간 내 복구가 가능해야 하지만, 며칠간 서비스가 마비된 것은 국가적 기준을 충족하지 못했음을 의미합니다.

이러한 시스템 붕괴는 정부가 '안전 투자'를 비용으로만 인식하는 구조적 관행에서 비롯됩니다.

국가 전산망 구축 및 유지보수 사업에서 '최저가 입찰'이 관행화되면서, 기술력과 전문성보다는 가장 낮은 비용을 제시한 업체가 사업을 수주하게 된다. 이는 숙련된 IT 인력의 이탈과 안전 관련 장비 및 유지보수 예산의 축소로 이어져 시스템의 잠재적 위험을 키웠다.

정부는 디지털 전환을 외치면서도, 그 기반인 물리적 인프라(전산실, 소방설비, 냉각시스템 등)와 보안 및 재해 대비 시스템에 대한 투자에는 인색했다는 지적을 피하기 어렵다. 이는 평소 시스템의 작은 오류를 키우고, 대형 재난에 취약한 '빚 좋은 개살구' 상태를 만들었다.

시스템 구축 및 운영 관리가 복잡한 다단계 하청 구조로 이루어지면서, 사고 발생 시 책임 소재가 불분명해지는 문제가 반복된다. 최종 책임은 늘 하청업체나 말단 관리자에게 전가되고, 시스템 전체를 설계하고 예산을 승인한 상위 의사결정권자는 책임에서 벗어나는 경향이 강했다.

정부는 이번 사태를 계기로 구호가 아닌 실질적인 데이터와 예산에 기반한 대책을 마련해야 한다.

국가 핵심 시스템에 대해서는 최저가 입찰을 즉각 폐지하고, 기술력 및 재해복구 능력(DR)에 대한 평가 비중을 절대적으로 높이는 '안전 우선 입찰제'를 도입해야 한다.

모든 국가 전산 시설에 대해 전문가와 시민단체가 참여하는 투명한 안전 진단을 실시하고, 각 시스템의 실질적인 복구 소요 시간(RTO)과 데이터 손실 허용 범위(RPO를 공개하여 국민적 감시를 받아야 한다.

재난 발생 시 책임 소재를 명확히 하는 법적 제도를 강화하고, 국가 핵심 전산망을 관리하는 인력의 처우를 개선하고 전문성을 강화하여 안정적인 시스템 운영 역량을 확보해야 한다.

정부는 더 이상 디지털 전환의 화려한 구호 뒤에 숨어 값싼 안전을 방치해서는 안된다. 시스템 붕괴는 곧 국가 기능의 붕괴라는 냉정한 현실을 직시하고, 재발 방지를 위한 구조적 개혁에 나서야 한다.

기고 김효범 : 한국화재감식연구소장, 한국화재감식학회 이사