"야간작업 하기 싫어...KT·협력사 합의하 낮에 작업"
"관리자는 다른 업무로 부재...테스트없이 원격작업"
[서울=뉴스핌] 나은경 기자 = 지난 25일 점심에 1시간여 동안 발생한 유무선 통신장애는 KT와 협력사가 야간작업을 꺼려 중요한 네트워크 변경작업을 낮에 하면서 발생한 것으로 밝혀졌다.
중요한 네트워크 작업을 사전 안전장치나 감독관 없이 낮에 진행했지만 현행법으로는 이를 사전에 규제할 수 없었다. 이에 대해 주무부처인 과학기술정보통신부는 "10여년전부터 파란불에 횡단보도를 건너는 것만큼 상식적으로 이뤄지던 일이 지켜지지 않은 것"이라며 이전에는 정부도 규제대상으로 생각하지 못했다는 입장을 내놨다.
과기정통부와 방송통신위원회 등 관계부처들은 추후 네트워크 안정성 강화대책을 마련해 해당 내용을 보완할 계획이다.
과기정통부는 29일 오후 3시 정부서울청사에서 조경식 제2차관이 참석한 가운데 KT 네트워크 장애 사고에 대한 원인을 발표했다.
과기정통부는 이번 KT 네트워크 장애사고가 지난 25일 오전 11시16분 시작돼 도메인네임시스템(DNS) 트래픽 증가에 이어 네트워크 장애가 발생, 낮 12시45분께 복구조치가 완료되는 등 약 89분간 지속됐다고 밝혔다.
[서울=뉴스핌] 김학선 기자 = 조경식 과학기술정보통신부 제2차관이 29일 서울 종로구 정부서울청사 합동브리핑실에서 KT 네트워크 장애 원인분석 결과를 발표하고 있다. 2021.10.29 yooksa@newspim.com |
다음은 홍진배 과기정통부 정보보호네트워크정책관(국장), 허성욱 과기정통부 네트워크정책실장, 최성준 과기정통부 네트워크정책과장, 이소라 방송통신위원회 이용자보호과장과의 일문일답.
-상식적으로 낮에 네트워크 작업을 한다는 것을 이해하기 어렵다.
▲홍진배 과기정통부 정보보호네트워크정책관(이하 홍): 낮에 작업하는 것은 KT 작업원칙에도 맞지 않는 것. 작업계획서상에도 새벽에 하도록 그렇게 돼 있었으나, 작업자(협력사)들과 관리자(KT)들이 합의 아래 원칙을 어기고 작업했다. 이번 네트워크 안정성 강화대책에 이 같은 내용을 충분히 반영해서 보완해 나가겠다.
-KT와 협력사가 새벽에 작업을 하지 않고 주간에 작업한 이유에 대해 어떻게 설명했나?
▲홍: 본인과 당사자, 관리자에게 직접 확인한 결과, 야간작업을 좋아하는 사람은 없기 때문에 주간작업을 선호했던 것으로 파악했다.
-현장에서 KT 감독자들 없이 협력업체들만 작업을 진행한 것으로 나왔는데, 왜 KT 관리자들은 없었나?
▲최성준 과기정통부 네트워크정책과장: 관리자에게 확인한 결과, 다른 업무가 있어 자리를 비웠다고 들었다.
▲허성욱 과기정통부 네트워크정책실장: 보충설명 드리자면 네트워크 작업은 야간에 한다거나 네트워크 작업시 한 두 시간 테스트를 먼저 하고 오픈해야 한다는 것은 10여년전부터 기본상식. 관리자 없이 용역업체가 홀로 작업하는 것도 마찬가지. 신호등 파란불에 횡단보도를 건너라는 것과 같은 사안이어서 사실 이 부분을 정부가 제도적으로 규제해야 하는 대상인지, 저희도 사고 발생 후 당황스러운 측면이 있다. 앞으로 제도적인 부분을 다시 검토해보겠다.
-이번에 문제가 발생한 부산지사는 정부관리 A급 시설이라고 들었는데. 기간통신사업자가 A급 관리시설을 외주업체에 맡긴 것이 이해가 되지 않는다.
▲홍: 등급이 A, B, C, D 네 가지 시설 등급이 있고, 이번에 작업이 이루어진 교체 대상인 라우터가 있던 곳은 C급 부산국사였다. 그곳을 원격으로 A급인 부산통신센터에서 작업하다가 발생한 사고. A급이냐, C급이냐를 떠나서 원격으로 작업을 진행하고, 협력사 직원이 관리자 없이 이렇게 진행을 하고, 주간에 네트워크를 연결해서 한 행태, 그것은 다 적절하지 않다고 생각한다.
-KT에서 애초에 디도스가 원인이라고 언급했는데, 정부 차원에서 통신장애 원인을 더 빨리 파악할 수 있는 프로세스는 없나?
▲홍: 정부도 트래픽 증가에 대한 모니터링을 했고, 네트워크 트래픽(이 급증한 것을) 디도스 차원으로 인지해서 정부도 그때 출동해 1차조사를 했다. 그때 저희도 패킷 분석을 해보니 디도스는 아닌 것 같다는 판단을 했다.
-다른 통신사업자들 같은 경우에도 유사 오류 발생시 전국으로 장애가 확산되는 것을 막는 안전장치나, 가상 테스트베드를 갖추고 있는 곳들이 있나?
▲홍: 먼저 발생 당일 저희가 주요 통신사업자들, ISP를 대상으로 긴급점검에 나서 (KT 통신장애와 같은) 문제가 있는지 점검을 요구했다. ISP들에 안전조치를 하라는 지시는 내렸으나 네트워크 구조나 이런 부분들은 개별사업자의 자산이기 때문에 (현재 안전장치나 테스트베드 구축여부 등은) 파악은 하지 못했다. 대책 마련 과정에서 함께 파악하고 개선점을 찾아갈 계획이다.
-KT아현국사 화재 이후 3년만에 다시 대규모 통신장애가 발생했는데, 사전에 막지 못한 이유는?
▲홍: 정부가 발생할 수 있는 사고나 재난을 모두다 예상할 수 있다면 (좋았겠지만). 3년 전에는 화재사고, 물리적 재난이 발생했던 상황이었다. 그래서 당시 대책들은 물리적·국지적 재난에서 어떻게 대응느냐에 포커스가 맞춰져 있었다.
이번 사고는 문제가 시스템적 레벨로 올라온 상황. 시스템 전체에 장애가 발생했을 때 어떻게 대응하는가, 라는 경험해 보지 못한 새로운 장애가 나타난 것이고, 그것에 대해서 저희가 한 발 한 발 잘 대응해 나가는 것이 지금부터 중요하다고 생각한다.
-네트워크 안정성 확보방안이 적용되는 주요 통신사업자들은?
▲홍: 주로 ISP들이 대상이 될 예정.
-KT 통신장애 타임라인은?
▲홍: 지난 25일 오전 11시16분 트래픽이 급증하기 시작했고, 오전 11시20분 KT에서 인터넷 장애를 인지. 이때쯤 KT에서 먼저 디도스 공격 가능성을 의심해 사이버공격으로 판단.
과기정통부에는 오전 11시40분에 신고를 했고, 오전 11시 44분에 KT에서 디도스 공격이 아닌 라우팅 오류로 판단하고 알려왔다. 이후 과기정통부가 오전 11시56분 2단계 경보를 발령하고, 상황을 지켜보는 상황에서 57분에 복구가 진행되기 시작했다. 오후 12시45분에는 복구 조치가 완료됐다고 보고를 받았다.
-KT에서 오전 11시44분에 디도스가 아니라는 것을 확인했는데 언론사에 통신장애 원인이 디도스라고 알린 것이 정오 경이었다.
▲홍: KT 확인이 필요한 문제이나 홍보실 및 내부 커뮤니케이션 오류가 아니었나 생각.
-KT 이용자 손해보상 관련, 오늘 오전 KT에서 이사회 열었다고 하는데 피해구제 방안 관련 이사회 결정내용에 대해 전달받은 것이 있나?
▲이소라 방통위 이용자보호과장(이하 이): 피해구제 관련 가장 중요한 것은 KT에서 이용자들의 피해를 정확하게 파악하는 것. 지금은 민원접수를 통해서 접수를 받고 있는 상태고, 조만간 별도 창구를 통해 현황을 더 면밀하게 파악할 것으로 알고 있다. 이를 토대로 KT에서 적절한 피해구제 방안을 마련할 것. 방통위에서는 이후 피해구제 방안들이 적절히 이행되는지 점검하겠다.
-인터넷 장애시 이용자에게 알려야할텐데 이번 사고에서는 그런 조치가 없었다. 발표내용 보면 문자와 음성이 분리돼 있어 KT도 문자로 서비스 장애를 안내할 수 있었을 텐데 왜 하지 않았나?
▲이: 3년전 KT 아현국사화재 이후 이용자 고지 필요성이 제기돼 그때 전기통신사업법이 개정됐고, 그에 따라 시행령도 개정됐다. 현행 시행령 제37조11의3항에 따라 전자우편, 휴대전화 문자메시지, 홈페이지 등 중에 하나의 방법으로만 고지하면 된다고 돼 있어, KT에서는 홈페이지로 고지한 것 같다. 앞으로 더 편리한 고지방법에 대해 개정을 검토하겠다.
-전기통신사업법상 통신장애 보상기준 개정 검토하고 있다고 했는데.
▲이: 어제 국회 과방위원님들 참석하신 간담회에서 해당 약관의 개정 필요성에 대해서 많은 지적을 주셨다. 현 시점에서는 구체적으로 논의하고 있는 방안이 없으나, 여러 이해관계자, 전문가 의견수렴을 거쳐 적절한 개선방안을 마련하도록 하겠다.
nanana@newspim.com