구글 검색, 번역, 사진 등에 머신러닝 적용.."대중 활용 기대"
[뉴스핌=이수경 기자] 구글은 전범위적으로 자사 제품에서 머신러닝 기술을 적극적으로 활용하고 있다. 점차 그 활용도를 높여나가는 동시에 제3자 개발자들이 자사 솔루션을 활용할 수 있도록 오픈 API로 확장한다는 계획이다.
구글코리아는 지난 9일 서울 포시즌스 호텔에서 머신러닝 기술에 대한 구글의 비전에 대해 발표하는 기자 간담회를 개최했다. 머신러닝에 대한 설명에는 제프 딘 구글 수석 연구원이 나섰다.
제프 딘은 구글 리서치 그룹의 구글 수석 연구원이다. 현재 미국 마운틴뷰에 위치한 구글 본사에서 구글 딥러닝 리서치 팀인 구글 브레인 팀을 이끌고 있다.
제프 딘 펠로우는 "안드로이드, 지메일, 구글 지도, 구글 사진 등 자사 다양한 제품에 머신러닝이 활용되고 있다"며 "그 비중은 대략 20~25% 정도 될 것 같다"고 밝혔다.
구글 포토(Google Photos)가 대표적인 예다. 기존 사진 프로그램에서는 사용자가 직접 '꽃', '개', '음식’과 같은 의미(레이블)를 일일이 붙여서 사진을 분류해야 한다. 그러나 구글 포토에서는 사진이 자동 정렬된다. 구글 포토에 사진을 올리기만 하면 자동으로 '개’와 관련된 사진만 추려서 보여주는 셈이다.
구글 음성 인식은 사람마다 다른 액센트, 언어, 음의 높낮이도 분별할 수 있도록 계속 지식수준을 높이는 중이다. 잡음이 크거나 마이크와 목소리가 멀리 떨어져 있는 상황에서도 음성을 정확하게 인식하기 위한 정확도 개선 작업도 함께 이뤄지고 있다.
구글 지메일의 인박스(Inbox)에서는 스마트 리플라이(Smart Reply)가 적용돼 있다. 메일 내용을 분석해 답신 예제 3가지를 제공하는 기능이다. 핸드폰에서는 장문의 글을 작성하기 어려운 점에 착안했다는 것이 제프 딘의 설명이다.
구글 번역 앱도 머신러닝을 활용한다. 구글 번역 앱을 켜서 텍스트에 카메라 초점을 맞추는 것만으로도 즉시 번역된 콘텐츠가 화면에 표시된다. 본래 텍스트와 비슷한 글씨체로 치환돼 보인다. 이를 위해 구글은 지난 2014년 5월 워드렌즈(Word Lends)를 인수하며 이미지 번역 기능을 추가한 바 있다.
제프 딘 구글 수석 연구원인 9일 포시즌스호텔 서울에서 머신러닝 원리에 대해 설명하고 있다. <사진=구글코리아> |
딘에 따르면 머신러닝은 '감독학습'으로 다량의 정보를 학습한다. '감독학습'은 마치 선생님의 지도 하에 학생이 학습하는 것에 비유할 수 있다. 특정 데이터에 대해 레이블을 대입해가는 과정이다.
학습방법이 다른 머신러닝 시스템도 있다. '비감독학습'은 유사한 이미지값들끼리 그룹화하는 것으로, 다만 특정 레이블은 인식하지 못한다. 고양이와 개를 분류는 하지만, 그룹화한 대상의 의미가 무엇인지는 모른다는 의미다.
딘 연구원는 "감독학습은 제대로 된 값만 입력된다면 학습 효과가 크기 때문에 많은 사람들이 선호하고 있다”며 "많은 훈련을 거치면 사전에 학습하지 않은 사진이나 이미지를 보고 사물을 인지할 수 있게 되는 것"이라고 말했다.
지난해 11월 공개된 머신러닝 오픈소스 라이브러리인 텐서플로우는 출시 5개월 만에 가장 많이 활용되는 것 중 하나로 부상했다.
제프 딘은 "구글은 자사 서비스에만 머신러닝을 도입하는 것에만 국한하지 않고 제3자 개발자도 이용할 수 있도록 공개하고 있다"며 "전세계적으로 머신러닝을 활용한 더 좋은 제품을 만나볼 수 있게될 것으로 기대된다"고 밝혔다.
한편, 업계에서는 인공지능이 4차 혁명이 될 것이라고 보고 있다. 그러나 머신 러닝이 악용될 수 있는 우려도 함께 존재하는 것.
이에 대해 제프 딘 연구원은 "머신러닝은 점차 더 중요해질 것이다. 더 나은 제품을 만들 수 있고 인간과 컴퓨터의 상호소통을 강화할 수 있다고 보기 때문”이라며 "인류에 위협이 될 수도 있지만, 모든 신기술에 다 여기에 해당한다. 인류 사회가 머신러닝을 선의의 목적을 가지고 활용할 수 있도록 노력해야 한다"고 답했다.
[뉴스핌 Newspim] 이수경 기자 (sophie@newspim.com)