
인더뉴스 김용운 기자ㅣ”파란 불에 신호를 건너지 않아서 교통사고가 난 것 같은 상황이었다.“
지난 25일 오전 전국적으로 발생한 KT[030200]의 통신 불통 사태는 애초 거론했던 외부의 디도스 공격이 아니라 KT의 관리 부실과 기본적인 작업 절차를 외면했던 데 따른 인재였던 것으로 드러났습니다.
과학기술정보통신부가 29일 발표한 KT 네트워크 장애 원인 분석 결과에 따르면 사고는 지난 25일 낮 KT 부산국사에서 기업망 라우터(네트워크간 통신을 중개하는 장치)를 교체하던 중 일어났습니다.
당초 KT 네트워크관제센터는 협력업체가 교체 작업을 26일 오전 1∼6시에 진행하도록 승인했습니다. 하지만 계획이 바뀌어 25일 낮에 교체작업을 진행했습니다.
홍진배 정보보호네트워크정책관은 "과기부가 수사를 한 것은 아니다“고 전제 한 뒤 ”협력업체 직원들과 KT 관리자에게 직접 확인했다"며 "왜 주간작업을 했는지는 '야간작업을 좋아하는 사람은 없기 때문에 주간작업을 선호한 것'으로 파악됐다"고 밝혔습니다.
25일 낮에 라우터를 교체하는 과정에서 KT는 시험 운행을 아예 하지 않았습니다. 또한 중요 장비를 교체하는 현장에 KT 직원은 없었고 협력업체 직원만 있었던 것으로 드러났습니다.
사고의 직접 원인은 이른 바 휴먼 에러로 불리는 사람의 실수였습니다.
협력업체 직원이 교체 장비의 '라우팅'(네트워크 경로 설정)을 하다가 정보를 입력하는 과정에서 들어가야 할 명령어 중 '엑시트'(exit)라는 단 한 단어를 빠뜨린 것입니다.
이 때문에 통상 BGP(보더 게이트웨이 프로토콜, 외부 라우터와 경로 정보를 주고받는 프로토콜)에 들어가야 할 경로 정보가, 그 수십분의 1 수준의 경로 정보를 교환해 주는 내부용 IS-IS 프로토콜로 한 번에 몰리면서 오류가 발생했고 교체 작업 중간인 25일 오전 11시 16분께부터 네트워크 장애가 시작돼 낮 12시 45분까지 89분간 서비스가 먹통이 됐습니다.
과기부는 라우터 교체과정에서 시스템에 지장을 주지 않고 이 오류를 미리 발견해 수정할 수 있는 가상의 테스트 베드(시험공간)가 없었고, 지역에서 발생한 오류가 전국으로 확산하는 것을 차단할 수 있는 시스템도 부재했다고 지적했습니다.
허성욱 과기정통부 네트워크정책실장은 "네트워크 작업을 야간에 하거나, 이런 작업을 한두시간 시험한 뒤 오픈한다는지 이런 건 10여 년 전부터 기본 상식이라 정부가 규제해야 할 대상인지 아닌지 (의문이다)"라며 “파란 불에 신호를 건너지 않아서 교통사고가 난 것 같은, 생각지도 못한 사고라 저희도 당황스러운 건 사실이다"라고 말했습니다.
한편 KT 측은 정부의 사고 조사결과를 발표한 직후에 보상안을 내놓을 것으로 예상했지만 보상안에 대한 뚜렷한 방침을 이날 오후까지 밝히지 않고 있습니다.