사고조사반 조사·분석 결과 DDOS 공격은 없어
부산국사 라우터 교체 작업 중 'exit' 명령 누락이 원인...관리 부실로 전국 확산

지난달 25일 발생한 KT 네트워크 장애 사고는 KT 부산국사에서 기업 망 라우터 교체작업 중에 일어난 실수 때문인 것으로 드러났다.

특히 사고조사반이 KT의 관리적·기술적 문제점을 확인했다고 지적함에 따라 이용자 피해 보상을 피하기는 어려울 것으로 보인다.

과학기술정보통신부(장관 임혜숙)은 정보보호 및 네트워크 전문가로 구성한 사고조사반과 함께 원인을 조사·분석한 결과 분산서비스거부공격(DDOS)은 없었고, KT 부산국사에서 기업용 라우터 교체 작업을 하던 작업자가 잘못된 설정을 입력한 것이 전국적인 인터넷 네트워크 장애로 연결된 것으로 분석됐다고 지난달 29일 발표했다. 

인터넷 서비스를 제공할 때 PC와 스마트폰 등 개인의 접속단말은 지역라우터와 센터라우터 등을 거쳐 국내외 네트워크에 연결된다. 이 때 정상적으로 연결하려면 이용자 단말과 접속 대상 IP 주소 사이에 있는 다수의 라우터 경로정보가 필요하다. 라우터는 네트워크 경로정보를 구성하기 위해 최신 경로정보를 라우터끼리 교환하는 프로토콜을 사용한다. KT 네트워크와 외부 네트워크 경로 구성에는 BGP 프로토콜을 사용하고, KT 내부 네트워크 경로 구성에는 IS-IS 프로토콜을 사용한다. 

KT의 네트워크 구조
KT의 네트워크 구조

그런데, KT 작업자의 작업내역을 확인한 결과, 사고발생 라우터에 라우팅 설정명령어 입력과정에서 IS-IS 프로토콜 명령어를 마무리하는 부분에 'exit' 명령어를 누락해 BGP 프로토콜에서 교환해야 할 경로정보가 IS-IS 프로토콜로 전송됐다. 이로 인해 통상 1만개 내외의 정보를 교환하는 IS-IS 프로토콜에 수십만개의 BGP 프로토콜 정보가 잘못 전송되면서 라우팅 경로에 오류가 발생했다. 

IS-IS 프로토콜 내의 라우터는 정보 최신화를 위해 상호간에 자동으로 데이터를 주고받는데, 부산 지역라우터에 잘못 성정된 라우팅 경로가 다른 지역에 전달되면서 결국 전국으로 장애가 확산됐다. 잘못된 데이터 전달에 대한 안전장치가 없었던 것이 장애를 키웠다.

IPTV 서비스망과 음성전화 및 문자서비스망은 인터넷 서비스망과 별도로 구성돼 있음에도 접속이 원할하지 못한 장애가 발생한 것은 인터넷 서비스 장애로 전화와 문자 이용이 늘어난데다 기기에 문제가 있는 것으로 오인해 단말 전원을 리셋하는 이용자가 많아 트래픽이 증가하고 부하가 가중됐기 때문인 것으로 추정됐다.

조사반은 당초 KT네트워크관제센터가 야간작업을 승인했으나 작업은 주간에 수행됐고, 작업 관리자 없이 KT 협력업체 직원들끼리만 라우팅 작업을 수행하는 등 작업관리체계가 부실했다고 지적했다. 또 네트워크가 연결된 채 작업이 이루어진 사실도 확인했다.

라우팅 오류의 전국 전파 과정
라우팅 오류의 전국 전파 과정

기술적으로도 스크립트 작성과정이나 사전 검증 과정에서 오류를 발견하지 못할 정도로 문제가 있었고, 일부 지역에서 발생한 오류가 전국으로 확산되는 것을 차단할 시스템도 부재한 것으로 나타났다.

이에 과기정통부는 주요 통신사업자 네트워크의 생존성·기술적·구조적인 대책을 담은 '네트워크 안정성 확보방안'을 마련할 계획이다. 과기정통부 네트워크정책실장을 단장으로 네트워크 전문가 등 관계 전문가들과 TF를 구성해 운영을 추진하기로 했다.

단기대책으로는 주요 통신사업자의 네트워크 관리체계와 기술적 오류 확산 방지 체계 등 네트워크 관리체계를 점검하고, 주요 통신사업자가 네트워크 작업으로 인한 오류 여부를 사전에 진단할 수 있는 시뮬레이션 시스템을 도입하는 방안을 검토할 예정이다. 통신사업자의 네트워크 관제센터에 기술적 점검 체계륵 구축하도록 하고, 라우팅 작업을 할 때 한 번에 업데이트 되는 경로정보 갯수를 일정 수준 이하로 제한하는 방안도 검토한다.

중장기 대책으로는 주요 통신사업자의 통신장애 대응 모니터링 체계 강화와 네트워 안정성과 복원력을 높이는 기술개발 및 안정적인 망 구조 등 네트워크 생존성 확보를 위한 구조적 대책 마련 등을 추진할 예정이다.

한편 KT는 이용자 피해를 보상하기 위해 피해현황을 조사하고 피해구제 방안을 마련할 예정이다. 이행 여부는 방송통신위원회가 점검한다. 방통위는 또 통신장애 발생 시 실요성 있는 피해구제를 위한 법령 및 이용약관 등 개선방안 마련도 검토할 계획이다.

키워드

#KT #통신장애
저작권자 © 테크데일리(TechDaily) 무단전재 및 재배포 금지