• 맑음동두천 -2.1℃
  • 맑음강릉 8.6℃
  • 박무서울 3.4℃
  • 맑음대전 4.6℃
  • 맑음대구 -0.5℃
  • 맑음울산 3.1℃
  • 구름많음광주 5.1℃
  • 맑음부산 8.3℃
  • 맑음고창 4.9℃
  • 구름조금제주 12.6℃
  • 맑음강화 -0.6℃
  • 맑음보은 0.4℃
  • 맑음금산 3.5℃
  • 맑음강진군 1.0℃
  • 맑음경주시 -2.7℃
  • 맑음거제 6.4℃
기상청 제공

2025년 12월 07일 일요일

메뉴

기획


[기획] 화마에 휩쓸린 디지털 심장, 세계 최고 ‘전자정부’의 민낯

지난달 26일 국정자원 대전본원 화재 한달...복구율은 50% 겨우 넘어
UPS 노후화와 이중화 부족 등 구조적 한계 그대로 드러나
디지털자원 중요성 커진 ‘AI 시대’...이중화·신뢰·복구력 강화 필요

 

지난 9월, 대전 국가정보자원관리원에서 발생한 화재는 정부 전산망의 절반 이상을 마비시키며 국민신문고, 정부24 등 주요 서비스가 중단되는 초유의 사태를 초래했다. 복구는 고도의 기술과 절차를 요하며, 국정자원 대구센터와 민간 클라우드로 시스템을 이전 중이다. 이 사고는 UPS 배터리 노후화와 이중화 부족 등 구조적 취약성을 드러냈다. 정부는 이를 계기로 클라우드 전환, SLA 기준 강화, 공주센터 설립 등 복구력과 디지털 안보 강화를 위한 체질 개선에 나서고 있다.

 

◇대전 데이터센터 화재, 정부 전산망 마비의 충격

 

2025년 9월 26일 저녁 8시 15분경, 대전 유성구에 위치한 국가정보자원관리원(이하 국정자원) 대전본원 5층 전산실에서 화재가 발생했다. 이 화재는 대한민국 정부의 전산망에 전례 없는 충격을 안겼다. 리튬이온 배터리의 발화로 추정되는 이번 사고는 단순한 화재를 넘어, 정부 주요 시스템 709개 중 절반 이상을 마비시키며 국민신문고, 정부24, 모바일 신분증 등 핵심 서비스가 중단되는 사태로 이어졌다.

 

정부는 즉각적인 대응에 나섰고 1·2등급 핵심 시스템을 10월 말까지, 기타 76개 시스템을 11월 20일까지 복구한다는 목표를 세웠다. 10월 현재 기준으로 전체 시스템 중 324개가 복구되어 45.7%의 진행률을 보이고 있다. 특히 국민신문고, 문서24, 복지로 등 국민 생활과 직결된 1등급 시스템은 77.5% 복구됐으며, 2등급 시스템은 55.9%, 3등급은 51.7%, 4등급은 23.5% 복구된 상태다.

 

복구 작업에는 공무원과 기술지원 인력 등 총 960명이 투입되었고, 서버 90식, 네트워크 장비 64식 등 총 198식의 신규 장비가 도입되었다. 피해가 심한 7·7-1·8 전산실의 시스템은 대구센터 및 민간 클라우드로 이전 중이며, 수기 행정과 대체사이트 운영을 통해 국민 불편을 최소화하고 있다. 이번 화재는 단순한 기술적 사고를 넘어, 디지털 인프라의 취약성과 국가 전산망의 복원력에 대한 근본적인 질문을 던지고 있다.

 

 

◇국정자원 대전본원의 복구가 더딘 까닭

 

복구 작업은 단순히 전원을 켜는 수준이 아니다. ‘안정화 → 청정화 → 재가동’이라는 3단계 절차를 거쳐야 한다. 먼저 항온항습, 전력, 네트워크 환경을 복원한 뒤, 해외 전문 인력이 서버와 스토리지를 분해해 내부에 쌓인 미세 분진을 제거하고 세척 및 검증을 진행한다.

 

이후에는 데이터 동기화, 애플리케이션 재배포, 인증·권한 연동까지 병행되며, 오류가 발생하면 재가동을 되돌려 점검을 반복해야 한다. 이처럼 복구는 고도의 기술과 정밀한 절차가 요구되는 작업으로, 시간이 오래 걸릴 수밖에 없다. 화재 당시 가장 큰 피해를 입은 곳은 대전본원 5층의 7-1 전산실이다. 해당 공간은 완전히 전소되었으며, 일부 시스템은 물리적으로 손상되었다. 이에 따라 96개 시스템은 대구센터의 클라우드 기반 인프라로 이전 중이다.

 

하지만 단순한 이전만으로 끝나지 않는다. 전기선로 교체와 데이터 정합성 검증이 병행되어야 하며, 이전 과정에서 발생할 수 있는 오류와 보안 문제도 함께 점검해야 한다. 물리적 피해는 복구 속도를 늦추는 가장 직접적인 원인 중 하나다.

 

화재의 원인으로는 UPS(무정전전원장치) 배터리의 노후화와 작업 중 전원 차단 미흡이 지목되고 있다. 해당 배터리는 2014년 설치돼 11년이 지난 상태였으며, 교체 시점이 지나 있었던 것으로 알려졌다. 이로 인해 현재 정밀 감식과 수사가 병행되고 있으며, 복구 작업에도 일정한 제약이 생기고 있다. 특히 사고 원인 규명이 완료되지 않은 상태에서는 일부 장비의 재가동이나 이전이 지연될 수밖에 없다.

 

정부는 복구 작업에 960여 명의 인력과 198식의 신규 장비를 투입했지만, 명절 연휴와 물리적 작업량으로 인해 속도에 한계가 있다는 지적이 나온다. 특히 일부 시스템은 대전센터에 잔류시키기로 했다가 다시 대구센터로 옮기는 등 복구 전략에 혼선이 있었다는 비판도 제기되고 있다. 이러한 혼선은 복구 일정에 영향을 줄 뿐만 아니라, 국민 불편을 가중시키는 요인이 된다. 복구 전략의 일관성과 체계적인 대응이 절실한 시점이다.

 

구조적 취약성과 이중화 부족도 문제로 제기되고 있다. 정부가 추진하던 ‘2시간 내 복구 기준(SLA)’은 이번 화재 당시 의무화가 적용되기 전이었기 때문에 무력화됐다.

 

행정안전부가 국가 정보망 보호를 위해 올해 서비스수준협약(Service Level Agreement, SLA) 표준안을 마련했다. 행안부가 올해 8월 발표한 공공 1·2등급 정보시스템 SLA 표준안에 따르면 1등급 시스템을 2시간 이내, 2등급 시스템을 3시간 이내에 복구해야 한다. 이와 함께 백업 및 이중화 체계가 충분히 작동하지 않아 복구에 수주 이상 소요될 수 있다는 비관론도 제기되고 있다.

 

 

◇국정자원 3대 센터의 역할과 복구 전략

 

국정자원은 대한민국 정부의 디지털 인프라를 책임지는 핵심 기관으로, 대전·광주·대구에 각각의 기능을 갖춘 데이터센터를 운영 중이다. 이번 화재를 계기로 각 센터의 역할과 복구 전략이 재조명되고 있다.

 

먼저 2005년 설립된 대전센터(제1센터)는 국정자원의 본원으로, 중앙부처의 핵심 행정정보시스템을 실시간으로 운영하고 백업하는 역할을 수행한다. 물리적 서버 기반의 전산실을 중심으로 전통적인 행정정보시스템을 관리해 왔다. 이번 화재로 인해 5층 전산실이 전소됐으며, 현재 화마 피해를 벗어난 일부 시스템은 2~4층 여유 공간으로 이전해 복구 중인 것으로 알려졌다.
2007년 정부통합전산센터로 출발한 광주센터(제2센터)는 재해복구(Disaster Recovery, DR) 및 이중화 기능을 중심으로 운영된다. 대전센터 등 주요 센터의 장애 발생 시 서비스 중단을 최소화하기 위한 복구 기능을 수행하며, 정보보호 및 사이버 보안 강화, 통신 관리, 정보자원 정책 지원 등 다양한 역할을 맡고 있다. 24시간 상시 모니터링 체계를 통해 무중단 서비스를 지원하며, 정부 디지털 전환의 기반을 마련하는 데 기여하고 있다.

 

2023년 설립된 대구센터(제3센터)는 클라우드 기반의 미래형 인프라를 중심으로 운영된다. 민관협력형 클라우드(PPP) 기반 시스템을 운영하며, 빅데이터와 인공지능 등 신기술 중심의 인프라를 구축하고 있다. 이번 대전센터 화재 이후 96개 시스템을 대구센터로 이전해 복구 중이며, UPS와 배터리 등 안정적인 전력 공급 인프라 점검도 완료된 것으로 파악되고 있다.

 

대전과 광주, 대구의 3대 센터는 각각의 역할을 통해 정부 전산망의 안정성과 복구력을 높이고 있으며, 이번 사태를 계기로 이중화 및 클라우드 전환의 필요성이 더욱 강조되고 있다.

 

한편 정부는 충남 공주시 사곡면에 공주센터(제4센터)를 백업센터의 역할로 총 2241억원 예산을 들여 설계했다. 공주센터는 대전본원, 광주센터, 대구센터 등 3곳의 기능이 동시에 마비될 경우에 대비한 트윈 백업센터의 역할을 하는 것이 기본 설립 목적이다. 하지만 이곳은 기존에 2008년에 설립을 추진해 2012년까지 완공 예정이었으나 사업자 선정 유찰, 입찰 방식 변경, 감리비 부족, 예산 삭감 등으로 아직 오픈하지 못하고 있다. 다수의 언론에 따르면 10월 기준으로 재난복구 시스템 공정률은 70%가 채 안 되는 것으로 알려졌다.

 

 

◇디지털 안보와 미래 과제, ‘이중화·신뢰·복구력’

 

대전 데이터센터 화재는 단순한 기술적 사고를 넘어, 디지털 인프라의 국가 안보적 중요성을 일깨우는 계기가 됐다. 이재명 대통령은 “디지털 안보는 국방에 버금가는 핵심 자원”이라며 복구에 투입된 인력을 격려했으며, 정치권과 국회는 DR 체계의 미흡과 배터리 노후화 문제를 집중 질의하며 정부 대응을 비판했다.

 

이번 사태는 크게 다섯 가지 교훈과 과제를 남겼다. 그 첫 번째는 ‘서비스 연속성 보장’이다. 장애가 발생했을 때에도 무중단 서비스를 제공할 수 있는 이중화 체계가 필수다. 특히 정부 민원 시스템, 병원 응급 시스템, 금융 거래 시스템 등 국민 생활과 직결된 서비스는 연속성이 중요하다. 두 번째는 ‘재해 대응 및 복구 시간 단축’이다. 화재, 정전, 사이버 공격 등 예기치 못한 사고에 빠르게 대응할 수 있는 복구 체계가 필요하다. 복구 시간(RTO)과 데이터 손실 허용 범위(RPO)를 최소화하는 체계적인 시스템 마련이 요구된다.

 

세 번째는 ‘국민 신뢰 확보’다. 전 국민을 대상으로 하는 공공서비스의 신뢰성과 투명성을 확보해야 한다. 시스템 중단은 사회적 혼란을 초래할 수 있으며, 이를 방지하기 위한 예방적·사전적 조치가 중요하다. 네 번째는 ‘보안 강화’다. 이중화된 시스템 간 보안 로그 및 이상 징후를 상호 감시해 사이버 공격이 발생했을 때 더 큰 피해 확산을 방지할 수 있다.

 

다섯 번째는 ‘유지보수 유연성’이다. 한 시스템을 점검하거나 업그레이드할 때 다른 시스템이 업무를 대체해 운영 중단 없이 유지보수가 가능하다. 정부 시스템은 24시간 365일 쉬지 않고 제 기능을 해야 한다. 이에 정부는 클라우드 기반 백업, AI 예측 진단 시스템 도입 등 디지털 인프라의 혁신을 추진하고 있다. 이번 사태를 계기로 정부는 국민의 신뢰를 회복하고 미래의 재난에 대비하기 위한 근본적인 체질 개선에 적극 나서야 할 것으로 보인다.

 

◇국가전산망 마비의 주요 원인, nTOPS 손상

 

국정자원에서 발생한 이번 사고 이전의 보안 사고를 살펴보면 행정안전부가 정춘생 조국혁신당 의원에게 제출한 자료를 통해 확인할 수 있었다. 이 자료에 따르면 2020년부터 2025년 6월까지 5년6개월간 총 63만4090건의 해킹 시도가 있었고, 정보유출이 22만9514건으로 최다였던 것으로 확인됐다.

 

이번 국가전산망 마비 사태는 아직 조사와 수사 중에 있지만 화재에 의한 통합운영관리시스템(National Total Operation Platform System, nTOPS)이 손상되어 발생한 것이 주요 원인으로 지목되고 있다. 이는 데이터가 저장돼 있는 서버실의 배터리 이설 작업 중 발생했으며, 배터리 잔류전류 차단 등 절차 준수 여부에 대해서는 현재 경찰이 수사하고 있다.

 

nTOPS는 불이 난 본원 5층 7-1 전산실이 아닌 다른 층인 6 전산실에 서버를 두고 있다. 이번 화재로 인한 직접적인 피해를 입지는 않았다는 의미다. 하지만 소방수를 뿌리기 위해 국정자원 내 전체 전원이 차단됐을 때 ntops 시스템도 강제로 차단됐다. 이때 시스템에 일부 손상을 입은 것으로 알려졌다.

 

초기에는 시스템 현황 파악이 어려워진 상황에서 초기에는 복구율 마저 13.5% 수준으로 확인되고 있다. 지난 10월 20일 기준 정부 행정정보 시스템 총 709개 시스템 중 373개가 복구돼 전체 시스템의 52.6%만이 정상화됐다. 지난 9월26일 화재로부터 약 26일간이 지났지만 당초 정부가 발표한 복구 시간에 한참이 지났음에도 절반을 겨우 넘기는 복구 상황이다.

 

 

◇효율적인 이중화 체계구축은?

 

이번 사고에서 특히 정부 전산망의 연결 구조를 총괄하는 ‘관제탑’ 시스템이 이중화되지 않았던게 신속한 피해 규모 확인 및 복구체계 마련에 혼선을 준 원인이기도 하다. 한 보안기업 기술이사도 이중화 시스템의 중요성을 언급하며 다시 한번 전산망 이중화가 주목받고 있다.

 

효율적인 이중화 체계를 구축하려면 크게 다섯 가지를 마련해야 한다. 첫 번째는 ‘3-2-1 백업 원칙 적용’이다. 3개의 데이터 복사본을 유지하고, 2개의 서로 다른 저장 매체에 저장하며, 1개는 클라우드 등 외부에 보관·저장하는 방식이다. 이는 단일 장애 지점을 제거하고, 데이터 손실 위험을 최소화하는데 도움이 된다.

 

두 번째는 물리적(지리적) 이중화(Geo-replication)다. 데이터를 서로 다른 지역의 데이터 센터에 분산 저장한다. 이 같은 분리 조치는 자연재해, 정전, 지역적 장애 발생 시에도 서비스 연속성을 보장할 수 있다. 세 번째는 ‘보안 및 무결성 강화’다. 이를 위해서는 엔드 투 엔드(End-to-End) 암호화, 다중 인증, 불변 스토리지를 통해 백업 데이터의 변조 및 삭제를 방지하는 것이 필요하다. 또 AI 기반 위협 탐지, 하루 24시간·일주일 내내 끊임없이 감시하고 관찰하는 24/7 모니터링으로 보안 위협을 사전에 차단한다.

 

네 번째는 ‘자동화 및 정기적인 복구 테스트’다. 자동화된 백업 모니터링으로 오류를 실시간 감지하고 대응한다. 정기적인 복구 테스트를 통해 실제 재해 발생 시 신속한 복구가 가능하도록 준비해야 한다. 다섯 번째는 ‘라이브 마이그레이션(Live Migration) 활용’이다. 서버를 중단하지 않고 가상머신(VM)을 실시간으로 다른 서버로 이전하는 방식이다. 서비스 중단 없이 유지보수나 장애 대응이 가능해 무중단 운영에 적합하다.

 

◇에너지 효율에 따른 인프라 설계는?

 

한 보안기업 데이터보호연구소 전임연구원은 에너지 효율에 따른 인프라 설계의 중요성에 대해 언급했다. 첫 번째는 ‘패시브 디자인 전략’이다. 태양광을 최대한 활용할 수 있도록 남향으로 배치하고, 그림자를 최소화하도록 설계한다. 또 창문 위치와 구조를 통해 바람 흐름을 활용한 냉방 효과를 주고, 고성능 단열재 및 이중·삼중 유리창으로 단열 및 기밀성을 강화한다.

 

두 번째는 ‘능동적 에너지 절약 기술’이다. 고효율 HVAC 시스템으로 스마트 제어가 가능한 냉난방 장비를 도입하고, 스마트 조명 시스템을 활용한다. 또 실내 공기를 배출할 떄 열 회수로 냉난방 비용 절감을 위해 에너지회수 환기 시스템(ERV/HRV)도 갖추는 것이 좋다.

 

세 번째는 ‘재생 가능 에너지의 통합’이다. 태양광 패널 설치로 자체 전력 생산이 가능하고, 지열 히트펌프로 지하 온도를 활용한 냉난방 시스템을 도입한다. 네 번째는 ‘스마트 에너지 관리 시스템’이다. 실시간 에너지 사용 모니터링·자동 제어로 BEMS(Building Energy Management System)를 도입하고, 스마트 온도 조절기로 자동으로 냉난방을 조절해야 한다.
다섯 번째는 ‘친환경 자재 활용’이다. 재활용 콘크리트, 목재, 천연 단열재 등 저탄소 건축 자재를, 태양열 반사율이 높은 외벽 및 지붕 마감재 등 고반사 외장재를 사용한다.

 

 

◇사이버 보안 앞서 물리적 인프라 취약성 한계 드러나

 

경기대 시큐리티매니지먼트학과 소속 한 교수는 “이번 사태의 원인과 결과를 볼 때 화재가 주 원인으로 이해되지만 그 시작점은 휴먼에러 혹은 구조적인 불안 요소에서 발생됐다”고 분석다. 이번 사태의 교훈은 기존 사이버 보안 사고의 중심이었던 해킹의 피해가 아닌 물리적인 영역에서 발생된 취약점으로, 사고 발생 이후의 복구 과정과 준비에 대한 부분이 미흡해 손실이 더 크게 생긴 사례라고 할 수 있다.

 

21세기에는 데이터가 중요해지면서 자산의 중심은 물리적인 재화나 유형의 자산에서 사이버 공간의 무형 자산의 중요성으로 변하고 있다. 따라서 데이터 보호는 단순히 데이터 침해 행위 외에 그 데이터를 담은 공간이나 데이터센터의 물리적인 구조의 중요성도 함께 대비해야 하는 것이다. 또 이에 맞춰 변화 기술에 대한 능동적인 취약점을 함께 고려해 설계나 레이아웃이 반영되어야 한다.

 

이번 사태의 문제점 개선을 위해 이중화와 같은 백업이 논의되지만 막대한 예산으로 쉽게 해결될 것은 아니다. 그럼에도 이중화 목표는 추진하되 추가로 개선이 필요한 부분이 있다.

 

첫째로 작업에 대한 인식과 물리적인 출입 통제이다. 데이터센터와 같은 중요한 시설은 출입이 되는 인원부터 물건 등 모든 이동에 대한 통제와 관리가 필요하다. 작업의 업무는 안전적인 측면이 있지만 어떤 공정이 출입하는 경우에는 사전 승인 과정과 취급에 주의가 필요한 영역에 대한 통제가 필요하다. 이를 보안 관점에서 관리해야 한다.

 

둘째로 기본적인 BCP나 재해복구, IT 백업 복구 정책은 대부분 기업이나 기관에서 존재하고 있지만, 보안부서에서 주관하고 있지 않다. 화재 대피와 같은 훈련은 안전부서나 경영지원부서에서 주관한다. 주요 자산 보호를 위해 유기적으로 보안부서에서 컨트롤타워 역할을 하거나 그 역할을 해야 하는 중추적인 담당이 있어야 한다.

 

셋째로 이번 사태의 핵심은 새로운 기술이나 재원의 인식과 취약점 대비책이 부족했다는 것이다. 소방기관과의 중요 자재 취급 협의 부분, 복구 과정에 대한 대비가 충분했는지가 가장 고려되어야 할 포인트다. 이러한 통제 역할과 요소가 포함된 컨트롤타워가 있어야 한다.

 

많은 IT 인프라 관련해 사이버적인 투자와 도입이 국내에서 많이 추진되고 있다. 특히, 최근 기업의 해킹 침해 사건 등으로 사이버 대응에 대한 투자는 진행되고 있지만, 물리적인 환경이나 구조에 대한 투자나 관심은 여전히 덜한 편이다. 맛있는 요리를 하기 위해 재료와 조리법에는 신경을 많이 쓰지만 그 음식이 담길 그릇에는 크게 관심이 없다면 결국 음식을 소분하거나 보관할 수 없는 결과로 이어질 것이다.




HOT클릭 TOP7


배너





배너

사회

더보기