전체기사 최신뉴스 GAM
KYD 디데이

[인간 vs 인공지능]알파고 데이비드 박사 "인간의 모방 아닌, 이기는 것이 우리 목표"

기사입력 : 2016년03월08일 15:39

최종수정 : 2016년03월12일 13:41

구글 알파고의 학습 비법은 '심층 신경망'과 '트리 탐색'

[뉴스핌=이수경 기자] "알파고(AlphaGo)가 흥분을 가져다주는 이유는 기계가 더 높은 수준으로 지식을 쌓아갈 수 있다는 기대에 부응하기 때문이다. 인간이 입력한 정보만 수행하는 것에 그치는 것이 아니라, 기계가 스스로 학습해서 인간과 같은 사고(思考)를 하게 만드는 것이 알파고의 최종 목표다." - 데이비드 실버 구글 딥마인드 리서치 사이언티스트 

미래창조과학부가 주최하고 소프트웨어정책연구소가 주관하는 '성큼 다가온 인공지능' 컨퍼런스가 8일 경기창조혁신센터에서 개최됐다. 

이날 데이비드 실버 구글 딥마인드 리서치 사이언티스트가 '심층 신경망과 트리 탐색을 이용한 바둑 게임 마스터하기'라는 주제로 발표에 나섰다. 

알파고는 지난 2014년 구글이 인수한 인공지능 기업 딥마인드에서 개발한 인공지능 컴퓨터로, 실버 박사는 알파고 프로젝트 팀 리더를 맡고 있다. 

구글 알파고 프로젝트 팀 리더를 맡은 데이비드 실버 박사가 8일 경기창조경제혁신센터에서 열린 '성큼 다가온 인공지능' 컨퍼런스에 참석했다. <사진=이수경 기자>

알파고의 학습 원리에 대해 실버 박사는 "무작위 대입을 통해 모든 경우의 수를 계산하는 '딥블루'와는 달리 알파고는 자가학습을 통해 지식체계를 구축해나간다"며 "남은 경기 내용을 미리 여러 번 진행해 미래를 예측하며, 선별적인 시뮬레이션을 통해 가장 성공적인 수를 찾는 것이 알파고의 특징"이라고 말했다. 

데이비드 실버 박사는 "알파고는 탐색의 최적화를 위해 정책망과 가치망이라는 2종류의 신경망을 구축했다"고 설명했다. 

'정책망'은 이길 가능성이 큰 후보군 위주로 탐색 너비를 줄여준다. 승률이 가장 높은 전략만 추려주는 것. '가치망'은 승자를 예측하며 탐색의 깊이를 줄여준다. 가상으로 게임을 플레이하지 않고도 승자를 예측할 수 있게 해주는 셈이다. 

이 신경망을 구축하기 위해 알파고는 3000만개의 바둑 기보를 '지도학습'했다. 5단 이상의 프로 전문기사가 바둑을 두는 방식을 교본삼아 4주 동안 스스로 학습한 것이다. 이후 자가대국(강화학습)을 통해 신경망을 정교하게 구축했다. 그 결과 인간이 두는 바둑의 수를 예측하는 정확도가 43%에서 57%로 높아졌다.  

실버 박사는 "지도학습을 통해 알파고가 기보를 스스로 학습할 수 있도록 하고 강화학습으로 스스로 학습을 통해 시행착오를 거쳐 승률을 높일 수 있도록 했다"며 "낮은 수준의 기보를 학습했다고 해서 알파고 학습 수준이 낮아지는 것은 아니고 최적의 탐색 알고리즘을 탐색하는 방향으로 학습 수준을 높이는 데 주력했다"고 말했다. 

특정 바둑 기사의 기보 스타일이 기계학습에 영향을 미치느냐는 질문에 실버 박사는 "아니다"라고 선을 그었다. 그는 "알파고가 바둑을 학습하기 위해서는 최소 수십만 개의 기보가 필요하다"며 "특정 기사의 기보를 소량 학습한다고 해서 알파고의 학습 결과에 큰 영향을 미치지는 않는다고 생각한다"고 설명했다. 

실버 박사는 "인간이 당면한 다양한 과제들을 하는 데 밑거름이 되도록 하는 데 알파고가 이바지하고자 한다"며 "구글 딥마인드에서 향후 고려하고 있는 것은 개개인의 의료 데이터를 학습해서 최적화된 치료법을 제공하는 맞춤형 의료 서비스 등이 있다"고 말했다. 

마지막으로 실버 박사는 "우리의 목표는 인간의 행동을 모방하는 것이 아니라 인간을 이기는 것"이며 "다양한 변수가 있어서 누가 이길지는 알 수 없지만, 개인적으로는 알파고가 이기길 기대하고 있다"고 밝혔다. 

 

[뉴스핌 Newspim] 이수경 기자 (sophie@newspim.com)

[뉴스핌 베스트 기사]

사진
정부조직 개편 방식 '안갯속' [서울=뉴스핌] 윤채영 기자 = 이재명 정부의 조직 개편 발표가 오는 8월 13일로 정해진 것으로 확인됐다. 국정기획위원회는 이달 말 대국민보고를 할 계획이었지만 미뤄지면서 정부조직 개편의 구체적인 방식은 안갯속이다. 26일 뉴스핌 취재를 종합하면, 국정위는 정부 조직 개편안 등을 이재명 대통령에게 보고하며 막바지 정리 작업 중에 있다. 개편이 유력한 기획재정부와 검찰 조직 등에 대한 추가 검토가 이뤄지고 있는 것으로 알려졌다. [서울=뉴스핌] 이길동 기자 =이한주 국정기획위원회 위원장.2025.07.22 gdlee@newspim.com 국정위는 당초 이달 중 대국민보고 등 주요 일정을 마칠 계획이었다. 국정위의 법적 활동 기한은 60일로 오는 8월 14일까지 활동할 수 있다. 1회 한해 최장 20일까지 연장할 수 있지만 국정위는 조기에 활동을 마무리 하겠다고 했다. 국정위의 속도전에 제동이 걸린 데는 정부의 첫 조직 개편인 만큼 조금 더 신중해야 한다는 목소리가 크게 작용한 것으로 알려졌다. 환경부와 산업자원통상부의 기후와 에너지 파트를 분리해 기후에너지부를 신설하는 과정에서 각 부처의 반발도 나오는 점 등이 대표적이다. 또 이 대통령이 이달 말에서 내달 초 방미 일정이 잡힐 수 있다는 점도 정부조직 개편이 늦어진 배경인 것으로 전해졌다. 1차 정부조직 개편안에는 기재부의 예산 분리 기능과 검찰청 폐지가 담길 것이 유력하다. 조승래 국정위 대변인은 앞서 "기재부 예산 기능을 분리하는 것과 (검찰청의) 수사와 기소 분리는 공약 방향이 명확하다"고 말했다. 기재부 조직 개편은 ▲예산 편성 기능을 분리해 과거의 기획예산처를 되살리고 나머지 기능은 재정경제부로 개편하는 안 ▲예산처가 아니라 재무부를 신설하는 안 ▲기재부 내에서 기능을 조정하는 안 등이 거론돼 왔다. 이 방안들을 놓고 국정위는 검토하고 있다. 현재는 기획재정부를 기획예산처와 재정경제부로 나누는 안이 유력한 것으로 알려졌지만, 국정위는 초안 등과 관련해서는 말을 아끼고 있는 상황이다. 검찰청 폐지 골자의 검찰 조직 개편안도 이번 조직 개편에 포함될 가능성이 높다. 이미 여당에서는 검찰의 수사권과 기소권을 분리하는 내용의 '검찰개혁 4법'을 발의했다. 김용민 더불어민주당 의원 등이 발의한 법안에는 검찰 권력의 핵심인 기소권은 법무부 산하에 공소청을 신설해 여기로 이관하는 내용이 담겼다. 수사권은 행정안전부 산하에 중대범죄수사청을 신설해 이곳으로 넘기기로 했다. 다만 수사권을 행안부 산하에 둘지 법무부 산하에 둘지를 두고는 여권 내에서도 이견이 있어 더 논의 중인 것으로 알려졌다. 금융위원회와 금융감독원 개편 방안을 놓고도 논의가 이어지고 있는 것으로 전해졌다. 당초 금융위 해체 차원의 '금융위 정책과 감독 기능 분리' 조직 개편안이 유력했다. 그러나 최근 여당에서 기획재정부 내 국제금융 업무를 금융위로 이관하는 내용의 법안을 발의하며 '금융위 존치론'이 급부상하고 있다. 금융위 해체론에 제동이 걸렸다는 목소리가 나오면서 이 역시도 오리무중인 상황이다. ycy1486@newspim.com 2025-07-26 07:00
사진
특검, 한덕수 자택·총리공관 압수수색" [세종=뉴스핌] 양가희 기자 = 내란특검팀이 24일 국무총리 서울공관에 대한 압수수색에 들어갔다. 국무총리실은 이날 문자 공지를 통해 특검팀의 수사에 적극 협조하고 있다며 이같이 밝혔다.   특검은 이날 한덕수 전 총리 자택 압수수색에도 나섰다. [서울=뉴스핌] 이형석 기자 = 한덕수 전 국무총리가 2일 오후 서울 서초구 서울고등검찰청에 마련된 내란 특검 사무실에서 조사를 마치고 차량으로 이동하고 있다. 2025.07.02 leehs@newspim.com 한 전 총리는 윤석열 전 대통령의 비상계엄 선포 계획을 알고도 이를 묵인 또는 방조했다는 의혹을 받고 있다. 특검은 압수물 분석을 마치는 대로 한 전 총리 등을 다시 조사한 뒤 구속영장 청구 여부 등을 검토할 전망인 것으로 알려졌다. sheep@newspim.com 2025-07-24 13:54
안다쇼핑
Top으로 이동