103개 언어 지원, 번역오류 최대 85% 감소
GNMT 개발자 마이크 슈스터 "인간의 언어 학습은 계속돼야"
[뉴스핌= 성상우 기자] 구글이 지난해 9월 공개한 '구글 신경망 기계번역(GNMT)'의 번역 품질이 인간 수준까지 근접한 것으로 평가했다. 특정 언어간 번역은 인간의 번역과 거의 차이가 없다. GNMT는 학습(Learning)하는 시스템이다. 시간이 지나고 학습 데이터가 축적될수록 번역 실력은 향상된다. 기계가 인간의 언어를 완벽하게 해석하는 시대가 성큼 다가왔다.
구글코리아는 9일 서울 대치동 구글 서울캠퍼스에서 '구글 AI 포럼'을 열고 인공지능과 GNMT에 대해 설명하는 자리를 가졌다. GNMT 개발자인 마이크 슈스터 구글 리서치 사이언티스트는 화상 강연 방식으로 이 자리에 참석, GNMT에 대해 "인간 수준에 근접했다"고 평가했다.
마이크 슈스터 구글 엔지니어가 화상 강연을 하고 있다. <사진=성상우 기자> |
GNMT는 구글이 지난해 공개한 새로운 번역 시스템이다. 문장을 단어와 구 단위로 쪼개 개별적으로 번역하던 기존 번역 방식(PBMT)과 달리 전체 문장을 한꺼번에 번역하고 맥락을 고려해 가장 적합한 번역을 선별한다. 이 시스템으로 번역 오류는 55~85% 줄었다. 현재 103개 언어를 지원한다.
특히, 한국어·영어의 경우 GNMT를 통해 번역 품질이 획기적으로 개선된 것으로 나타났다. 슈스터는 즉석에서 구글 번역기로 어니스트 헤밍웨이의 소설 '킬리만자로의 눈' 한 구절을 영문에서 국문으로 무리없이 번역, 이를 증명했다.
GNMT는 번역 품질 향상 외에도 번역 시스템이 한번도 시도해보지 않은 언어들 간의 번역도 가능케했다. '제로샷 번역'기술이다. 이를 통해 한국어·영어 간 학습과 영어·일본어 간 학습만 이뤄진다면 한국어·일본어 사이에는 별도 학습 없이도 번역이 가능해졌다. 이전에 학습한 '번역 지식'이 다른 언어 조합으로 전이되는 것이다. ‘학습의 전이’를 구현해낸 것은 구글이 최초다.
구글은 이런 방식으로 8개 언어에 대해 16개의 조합을 만들고 신경망 기계번역 기술을 적용했다. 조합 목록에는 한국어를 비롯, 영어·중국어·스페인어·포르투갈어·독일어·프랑스어·일본어 등이 포함됐다. 현재 프로덕션 단계에서 실행 중이다.
GNMT를 통한 번역 품질 개선효과는 트래픽 증가로 나타났다. 지난 2달간 안드로이드에서 한국어·영어 구글번역을 이용한 트래픽이 50% 증가했다. 슈스터는 이에 대해 "구글 번역의 정확성 개선으로 이용자 증가한 것으로 추정된다"고 말했다.
다만 슈스터는 이제 외국어 공부를 안해도 되느냐는 기자의 질문에 "언어학습은 구글번역과 상관없이 지속돼야 한다"며 "언어 학습의 과정에서 문화를 배우고 학습하는 방법 자체를 배운다. 이는 살아가면서 겪는 많은 문제들을 해결토록 도와줄 것"이라고 견해를 밝혔다.
박영찬 구글코리아 테크리더 역시 인공지능 만능주의를 경계했다. 그는 "인공지능과 신경망 기계번역이 완벽하게 인간처럼 사고하고 자율적으로 의사결정하는 것은 아주 먼 미래의 일"이라며 "인공지능은 인간의 창의성을 북돋아주는 도구일 뿐"이라고 말했다. 이어 "인공지능을 활용해서 무엇을 할 것이며 인류에게 어떤 가치를 제공할 지를 고민하는 것은 결국 인간의 영역"이라고 강조했다.
박영찬 구글코리아 테크 리더가 강연하고 있다. <사진=성상우 기자> |
[뉴스핌 Newspim] 성상우 기자 (swseong@newspim.com)