알파고 성장 경로 답습...'알파제로' 수준까지 접근
데이터 양과 질에서 구글과 차이 뚜렷
[편집자] '바둑판의 풍운아' 이세돌 9단이 현역에서 물러납니다. 상대의 의표를 찔러 난전을 즐겼던 승부사. 평범을 거부했기에 인공지능(AI)을 극복한 세계 유일의 기사. 은퇴 이벤트도 이목을 집중시킵니다. AI와 의 재대결. 구글 '알파고'와 대결후 3년9개월만입니다. 국내 기술진이 만든 '한돌'과 세 판을 둡니다. 종합뉴스통신 뉴스핌이 '세돌과 한돌의 대결'을 두 가지 측면에서 조명합니다. 인간과 AI의 두뇌싸움이란 측면과 알파고(구글)와 한돌(NHN)의 AI기술 대결입니다.
[서울=뉴스핌] 김지완 기자 = 이세돌 9단 은퇴대국 상대 인공지능(AI) '한돌' 실력은 알파고 최종버전 '알파제로'에 근접한 것으로 나타났다. 다만 구글 알파고와 NHN 한돌 사이를 구분짓는 확실한 '격차'가 존재한다는 게 전문가들의 평가다.
한돌은 10개월간의 개발 기간을 거쳐 지난 2017년 12월 '한돌' 버전 1.0을 출시했다. 이후 두 번의 판올림을 거치며 3.0버전까지 출시됐다.
출시 1주년을 맞은 지난해 12월 신민준 9단, 이동훈 9단, 김지석 9단, 박정환 9단과 국내 바둑 랭킹 1위 신진서 9단과의 대국에서 연이어 승리를 거뒀다. 올해 8월 중국 산둥성에서 열린 '2019 중신증권배 세계 인공지능(AI) 바둑대회'에선 3위를 달성했다.
<사진=이형석 사진기자> |
◆ 한돌, 알파고 성장 경로 그대로 답습...'알파제로' 수준 근접
한돌은 알파고 성장 경로를 그대로 따랐다. 이창율 NHN 게임AI팀장은 "한돌 1.0은 인간 기보를 사용해서 기력을 끌어올렸고, 2.0부턴 사람 기보 없이 자가 대국만으로 기력을 향상시켰다"며 "3.0에선 자가 대국 속도를 좀 더 빠르게 할 수 있도록 평가 과정을 없앴다"고 밝혔다.
그는 "그 결과 한돌 1.0은 프로기사를 상대로 60%의 승률을 보였다"며 "한돌 2.0은 1.0에 비해 90%의 승률로 개선됐다. 버전 3.0은 2.0에 대해 80~90% 승률을 기록했다"고 설명했다.
알파고 제로(Zero) 역시 인간의 기보에 의존하는 지도학습 없이, 바둑 규칙만으로 스스로 학습하며 기력을 끌어올렸다. 학습 36시간 만에 알파고 리(Lee)의 수준을 능가했다. 72시간 만에 알파고 리와 대국에서 100승에 이를 때까지 패배가 없었다. 40일 후 알파고 마스터와 대국에선 100전 89승 11패를 기록했다.
이에 한돌이 알파고 최종버전 '알파제로(Alpha Zero)' 수준에 근접했다는 분석이다.
알파제로는 점점 강해지는 자신과의 게임을 반복하면서 스스로 빅데이터를 구축하는 단계에 올라섰다. 알파고는 '판(Fan)' → '리(Lee)' → '마스터(Master)' → '제로(Zero)' → '알파제로(Alpha Zero)' 순으로 발전했다. 이세돌 9단과 승부를 겨뤘던 버전은 '알파고 리'.
이스트소프트 AI연구소의 수석연구원은 "알파고 각 버전의 기술이 공개되고, 이를 바탕으로 개발된 여러 바둑 인공지능들의 경쟁을 통해 기술이 발전하고 있다"며 "한돌은 최강으로 알려진 알파고 제로와 알파 제로에서 사용한 머신러닝 기술을 적용했다. 우리 인공지능 수준은 미국과 중국에는 다소 뒤지지만 사용하는 기술은 격차가 크지 않다"고 진단했다.
NHN 측은 딥러닝의 보편적 방식인 '하이퍼파라미터(Hyperparameter, 직접 세팅하는 값)'를 사용해 동시 학습을 진행했다고 전했다. 아울러 학습 속도를 높일 수 있는 최신 트렌드의 다양한 학습법을 많이 적용했다고 밝혔다.
이창율 NHN 게임AI팀장은 "알파고는 프로기사 9단하고만 대국을 했고, 은퇴를 해서 정확한 기력을 모른다"면서도 "하지만 논문을 기준으로 봤을 때, 한돌은 '알파고 리'는 넘어섰고, 알파고 제로나 알파제로 사이로 본다"고 평가했다.
구글 알파고는 2017년 10월 네이처에 '인간 지식 없이 바둑을 마스터하기', 지난해 12월 사이언스에 '자가학습을 통해 체스, 쇼기, 바둑을 마스터할 수 있는 범용 강화학습 알고리즘'을 각각 게재했다.
◆ 몬테카를로 기술 적용에선 알파고만큼 성과 못내..."데이터 차이만큼 실력차이 날 것"
다만 구글과 NHN 사이에 넘볼 수 없는 차이, '격차'는 존재한다.
한돌에도 알파고에서 쓰였던 '몬테카를로 트리 탐색(Monte Carlo tree search, MCTS)' 기술이 그대로 적용됐지만, 성과에선 차이를 보였다. MCTS는 상대방과 한번씩 번갈아 가면서 두는 바둑에서 실시간으로 자신과 상대의 가장 좋은 수를 시뮬레이션하면서 최적의 수를 찾는 방법이다.
이창율 팀장은 "알파고는 MCTS에 자가대국으로 만든 기보를 더해 다음 수에 대한 예측과 승리 확률을 높였다"면서 "우리도 MCTS를 놓고, 딥러닝/UCB(Upper Confidence Bound, AI 강화학습 방법 중 하나) 등의 알고리즘들을 실험 해봤지만, 성능이 그렇게 좋아지진 않았다"고 말했다.
그는 "다만 한돌엔 여러 사람이 의논해 좋은 수를 내는 것과 비슷한 '앙상블 추론(Ensemble Inference)'과 통계를 이용한 시뮬레이션으론 어느 정도 성능 개선이 나타났다"고 설명했다.
인공지능 성능을 판가름 짓는 데이터 양과 질에서도 구글에 비해 NHN은 한 수 아래란 평가다.
소프트웨어업체 인공지능을 담당중인 한 개발자는 "인공지능은 학습에 필요한 데이터와 장비의 규모가 성능을 좌우한다"면서 "한돌이 규모의 경제가 있는 미국·중국만큼 성능을 끌어올리는데 어려움이 있었을 것"이라고 분석했다.
또 다른 인공지능 개발자는 "알파고 알파제로 수준의 데이터를 한돌은 확보하지 못했다"며 "데이터 질적 수준과 양에서 구글과 NHN 차이는 뚜렷하다. 그 차이만큼 알파고와 한돌의 실력 차이가 존재할 것"이라고 평가했다.
swiss2pac@newspim.com