[뉴스핌=오영상 전문기자] 일본 정부가 인공지능(AI) 통역 기술을 민간에 개방해 기업들의 제품 개발을 뒷받침할 방침이라고 2일 니혼게이자이신문이 보도했다.
일본 총무성 산하 정보통신연구기구(NICT)가 보유한 동시통역 기간(基幹) 기술을 기업들이 활용할 수 있게 함으로써 초기 투자를 줄여 실용화에 착수하기 수월하도록 지원한다.
동시통역 시스템의 보급을 촉진함으로써 2020년 도쿄올림픽·패럴림픽에 대비해 방일 외국인과의 ‘언어 장벽’을 없애겠다는 계획이다.
NICT의 번역 기술은 관광에 중점을 두고 있는 것이 특징이다. 지난해 6월부터 심층학습(딥러닝)을 활용해 개선을 거듭, 방재나 쇼핑 등의 특정한 분야에서는 90% 전후의 정확도를 자랑한다. 구글 번역기보다도 자연스러운 표현이 많다.
이미 실용화된 애플리케이션 ‘보이스트라(VoiceTra)’는 31개 언어의 문자 번역이 가능하며, 그 중 영어와 중국어 등 16개 언어는 음성에 의한 번역 입출력이 모두 가능하다. 동시통역에서는 말하는 문장의 단락 등을 자동으로 판단해, 하나의 문장이 끝나고 나서 통역을 시작하는 기술 개발도 완료했다. 화상인식 기술을 사용해 표정을 보고 적절한 문자 데이터를 표시하는 기술 개발도 추진하고 있다.
일 총무성은 기업들에게 이러한 기술을 사용한 제품 개발을 독려하기 위해 시제품 단말기 간에 통역할 음성 데이터를 주고받는 AI 서버를 정부가 제공할 계획이다. 이 서버에는 NICT의 통역 기술을 탑재해 기업이 자유롭게 사용할 수 있도록 하고, 시제품 단계에서는 라이센스 비용도 받지 않을 방침이다. 구체적인 시행 방안을 마련해 올해 안에 실시할 예정이다.
정부의 기간 기술을 개방함으로써 다양한 아이디어를 가진 기업들의 제품이 시장에 선보이게 될 것으로 기대하고 있다. 또 술집 좌석에 부착돼 있는 터치패널식 주문 단말기에 동시통역 기술을 집어넣는 등 기존 단말기와 조합된 제품들도 등장할 것으로 보인다.
기간 기술을 민간에 개방하면 번역의 정확도가 높아지는 효과도 기대할 수 있다. 번역의 정확도를 높이기 위해서는 딥러닝을 활용하는 것은 물론 다양한 번역 데이터를 학습하는 것이 반드시 필요하다. 기업들이 사용했던 전문용어 등의 번역 데이터를 수시로 제공받게 된다면 보다 폭 넓은 용도에 대응할 수 있게 됨과 동시에 번역 가능한 언어도 늘릴 수 있게 된다.
딥러닝을 사용한 다언어 번역 개발은 미국의 구글이나 마이크로소프트 등 해외 기업도 힘을 쏟고 있다. 이러한 기업들은 자사의 기술을 외부와 공유하지 않는 것이 일반적이다. 하지만 데이터 축적에서 뒤처져 있는 일본은 민관이 함께 기술을 개발해 추격에 나선다는 방침이다.
[뉴스핌Newspim] 오영상 전문기자 (goldendog@newspim.com)