[기획] 화마에 휩쓸린 디지털 심장, 세계 최고 ‘전자정부’의 민낯

  • 등록 2025.10.17 09:10:30
크게보기

지난달 26일 국정자원 대전본원 화재 이후 20여일...복구율은 절반 못미쳐
기술적 난관과 이중화 부족 등 구조적 한계 그대로 드러나
디지털자원 중요성 커진 ‘AI 시대’...이중화·신뢰·복구력 강화 필요

 

지난 9월, 대전 국가정보자원관리원에서 발생한 화재는 정부 전산망의 절반 이상을 마비시키며 국민신문고, 정부24 등 주요 서비스가 중단되는 초유의 사태를 초래했다. 복구는 고도의 기술과 절차를 요하며, 국정자원 대구센터와 민간 클라우드로 시스템을 이전 중이다. 이 사고는 UPS 배터리 노후화와 이중화 부족 등 구조적 취약성을 드러냈다. 정부는 이를 계기로 클라우드 전환, SLA 기준 강화, 공주센터 설립 등 복구력과 디지털 안보 강화를 위한 체질 개선에 나서고 있다.

 

◇대전 데이터센터 화재, 정부 전산망 마비의 충격


2025년 9월 26일 저녁 8시 15분경, 대전 유성구에 위치한 국가정보자원관리원 대전본원 5층 전산실에서 화재가 발생했다. 이 화재는 대한민국 정부의 전산망에 전례 없는 충격을 안겼다. 리튬이온 배터리의 발화로 추정되는 이번 사고는 단순한 화재를 넘어, 정부 주요 시스템 709개 중 절반 이상을 마비시키며 국민신문고, 정부24, 모바일 신분증 등 핵심 서비스가 중단되는 사태로 이어졌다.


정부는 즉각적인 대응에 나섰고 1·2등급 핵심 시스템을 10월 말까지, 기타 76개 시스템을 11월 20일까지 복구한다는 목표를 세웠다. 10월 현재 기준으로 전체 시스템 중 324개가 복구되어 45.7%의 진행률을 보이고 있다. 특히 국민신문고, 문서24, 복지로 등 국민 생활과 직결된 1등급 시스템은 77.5% 복구됐으며, 2등급 시스템은 55.9%, 3등급은 51.7%, 4등급은 23.5% 복구된 상태다.


복구 작업에는 공무원과 기술지원 인력 등 총 960명이 투입되었고, 서버 90식, 네트워크 장비 64식 등 총 198식의 신규 장비가 도입되었다. 피해가 심한 7·7-1·8 전산실의 시스템은 대구센터 및 민간 클라우드로 이전 중이며, 수기 행정과 대체사이트 운영을 통해 국민 불편을 최소화하고 있다. 


이번 화재는 단순한 기술적 사고를 넘어, 디지털 인프라의 취약성과 국가 전산망의 복원력에 대한 근본적인 질문을 던지고 있다.

 

 

◇국가정보자원관리원 대전본원의 복구가 더딘 까닭


복구 작업은 단순히 전원을 켜는 수준이 아니다. ‘안정화 → 청정화 → 재가동’이라는 3단계 절차를 거쳐야 한다. 먼저 항온항습, 전력, 네트워크 환경을 복원한 뒤, 해외 전문 인력이 서버와 스토리지를 분해해 내부에 쌓인 미세 분진을 제거하고 세척 및 검증을 진행한다.


이후에는 데이터 동기화, 애플리케이션 재배포, 인증·권한 연동까지 병행되며, 오류가 발생하면 재가동을 되돌려 점검을 반복해야 한다. 이처럼 복구는 고도의 기술과 정밀한 절차가 요구되는 작업으로, 시간이 오래 걸릴 수밖에 없다. 화재 당시 가장 큰 피해를 입은 곳은 대전본원 5층의 7-1 전산실이다. 해당 공간은 완전히 전소되었으며, 일부 시스템은 물리적으로 손상되었다. 이에 따라 96개 시스템은 대구센터의 클라우드 기반 인프라로 이전 중이다. 

 

하지만 단순한 이전만으로 끝나지 않는다. 전기선로 교체와 데이터 정합성 검증이 병행되어야 하며, 이전 과정에서 발생할 수 있는 오류와 보안 문제도 함께 점검해야 한다. 물리적 피해는 복구 속도를 늦추는 가장 직접적인 원인 중 하나다.


화재의 원인으로는 UPS(무정전전원장치) 배터리의 노후화와 작업 중 전원 차단 미흡이 지목되고 있다. 해당 배터리는 2014년 설치되어 11년이 경과한 상태였으며, 교체 시점이 지나 있었던 것으로 알려졌다. 이로 인해 현재 정밀 감식과 수사가 병행되고 있으며, 복구 작업에도 일정한 제약이 생기고 있다. 특히 사고 원인 규명이 완료되지 않은 상태에서는 일부 장비의 재가동이나 이전이 지연될 수밖에 없다.


정부는 복구 작업에 960여 명의 인력과 198식의 신규 장비를 투입했지만, 명절 연휴와 물리적 작업량으로 인해 속도에 한계가 있다는 지적이 나온다. 특히 일부 시스템은 대전센터에 잔류시키기로 했다가 다시 대구센터로 옮기는 등 복구 전략에 혼선이 있었다는 비판도 제기되고 있다. 이러한 혼선은 복구 일정에 영향을 줄 뿐만 아니라, 국민 불편을 가중시키는 요인이 된다. 복구 전략의 일관성과 체계적인 대응이 절실한 시점이다.


구조적 취약성과 이중화 부족도 문제로 제기되고 있다. 정부가 추진하던 ‘2시간 내 복구 기준(SLA)’은 이번 화재 당시 의무화가 적용되기 전이었기 때문에 무력화됐다.

 

행정안전부가 국가 정보망 보호를 위해 올해 서비스수준협약(Service Level Agreement, SLA) 표준안을 마련했다. 행안부가 올해 8월 발표한 공공 1·2등급 정보시스템 SLA 표준안에 따르면 1등급 시스템을 2시간 이내, 2등급 시스템을 3시간 이내에 복구해야 한다. 이와 함께 백업 및 이중화 체계가 충분히 작동하지 않아 복구에 수주 이상 소요될 수 있다는 비관론도 제기되고 있다.

 

 

◇국가정보자원관리원 3대 센터의 역할과 복구 전략


국가정보자원관리원은 대한민국 정부의 디지털 인프라를 책임지는 핵심 기관으로, 대전·광주·대구에 각각의 기능을 갖춘 데이터센터를 운영 중이다. 이번 화재를 계기로 각 센터의 역할과 복구 전략이 재조명되고 있다.


먼저 2005년 설립된 대전센터(제1센터)는 국가정보자원관리원의 본원으로, 중앙부처의 핵심 행정정보시스템을 실시간으로 운영하고 백업하는 역할을 수행한다. 물리적 서버 기반의 전산실을 중심으로 전통적인 행정정보시스템을 관리해 왔다. 이번 화재로 인해 5층 전산실이 전소됐으며, 현재 화마 피해를 벗어난 일부 시스템은 2~4층 여유 공간으로 이전해 복구 중인 것으로 알려졌다.


2007년 정부통합전산센터로 출발한 광주센터(제2센터)는 재해복구(Disaster Recovery, DR) 및 이중화 기능을 중심으로 운영된다. 대전센터 등 주요 센터의 장애 발생 시 서비스 중단을 최소화하기 위한 복구 기능을 수행하며, 정보보호 및 사이버 보안 강화, 통신 관리, 정보자원 정책 지원 등 다양한 역할을 맡고 있다. 24시간 상시 모니터링 체계를 통해 무중단 서비스를 지원하며, 정부 디지털 전환의 기반을 마련하는 데 기여하고 있다.


2023년 설립된 대구센터(제3센터)는 클라우드 기반의 미래형 인프라를 중심으로 운영된다. 민관협력형 클라우드(PPP) 기반 시스템을 운영하며, 빅데이터와 인공지능 등 신기술 중심의 인프라를 구축하고 있다. 이번 대전센터 화재 이후 96개 시스템을 대구센터로 이전해 복구 중이며, UPS와 배터리 등 안정적인 전력 공급 인프라 점검도 완료된 것으로 파악되고 있다.


대전과 광주, 대구의 3대 센터는 각각의 역할을 통해 정부 전산망의 안정성과 복구력을 높이고 있으며, 이번 사태를 계기로 이중화 및 클라우드 전환의 필요성이 더욱 강조되고 있다.


한편 정부는 충남 공주시 사곡면에 공주센터(제4센터)를 백업센터의 역할로 총 2241억원 예산을 들여 설계했다. 공주센터는 대전본원, 광주센터, 대구센터 등 3곳의 기능이 동시에 마비될 경우에 대비한 트윈 백업센터의 역할을 하는 것이 기본 설립 목적이다. 하지만 이곳은 기존에 2008년에 설립을 추진해 2012년까지 완공 예정이었으나 사업자 선정 유찰, 입찰 방식 변경, 감리비 부족, 예산 삭감 등으로 아직 오픈하지 못하고 있다.

 

다수의 언론에 따르면 이달 기준으로 재난복구 시스템 공정률은 70%가 채 안 되는 것으로 알려졌다.

 

 

◇디지털 안보와 미래 과제, ‘이중화·신뢰·복구력’


대전 데이터센터 화재는 단순한 기술적 사고를 넘어, 디지털 인프라의 국가 안보적 중요성을 일깨우는 계기가 됐다. 이재명 대통령은 “디지털 안보는 국방에 버금가는 핵심 자원”이라며 복구에 투입된 인력을 격려했으며, 정치권과 국회는 DR 체계의 미흡과 배터리 노후화 문제를 집중 질의하며 정부 대응을 비판했다.


이번 사태는 크게 다섯 가지 교훈과 과제를 남겼다. 그 첫 번째는 ‘서비스 연속성 보장’이다. 장애가 발생했을 때에도 무중단 서비스를 제공할 수 있는 이중화 체계가 필수다. 특히 정부 민원 시스템, 병원 응급 시스템, 금융 거래 시스템 등 국민 생활과 직결된 서비스는 연속성이 중요하다.

 

두 번째는 ‘재해 대응 및 복구 시간 단축’이다. 화재, 정전, 사이버 공격 등 예기치 못한 사고에 빠르게 대응할 수 있는 복구 체계가 필요하다. 복구 시간(RTO)과 데이터 손실 허용 범위(RPO)를 최소화하는 체계적인 시스템 마련이 요구된다.


세 번째는 ‘국민 신뢰 확보’다. 전 국민을 대상으로 하는 공공서비스의 신뢰성과 투명성을 확보해야 한다. 시스템 중단은 사회적 혼란을 초래할 수 있으며, 이를 방지하기 위한 예방적·사전적 조치가 중요하다. 네 번째는 ‘보안 강화’다. 이중화된 시스템 간 보안 로그 및 이상 징후를 상호 감시해 사이버 공격이 발생했을 때 더 큰 피해 확산을 방지할 수 있다.


다섯 번째는 ‘유지보수 유연성’이다. 한 시스템을 점검하거나 업그레이드할 때 다른 시스템이 업무를 대체해 운영 중단 없이 유지보수가 가능하다. 정부 시스템은 24시간 365일 쉬지 않고 제 기능을 해야 한다. 이에 정부는 클라우드 기반 백업, AI 예측 진단 시스템 도입 등 디지털 인프라의 혁신을 추진하고 있다.

 

이번 사태를 계기로 정부는 국민의 신뢰를 회복하고 미래의 재난에 대비하기 위한 근본적인 체질 개선에 적극 나서야 할 것으로 보인다.

김영명 기자 paulkim@m-economynews.com
Copyright @2012 M이코노미뉴스. All rights reserved.



회사명 (주)방송문화미디어텍|사업자등록번호 107-87-61615 | 등록번호 서울 아02902 | 등록/발행일 2012.06.20 발행인/편집인 : 조재성 | 서울시 영등포구 국회대로72길 4. 5층 | 전화 02-6672-0310 | 팩스 02-6499-0311 M이코노미의 모든 컨텐츠(기사)는 저작권법의 보호를 받으며,무단복제 및 복사 배포를 금합니다.