인공지능(AI)도 신경세포 겹겹이 쌓이면 쌍둥이도 구별 가능
음성 인식, 스토리 인식 기능이 더해지면 영화 감상 가능해져
'파블로프의 개' 실험, 그리고 딥러닝
인공지능 시대의 도래를 가능케 만든 알고리즘이 딥러닝(Deep Learning)이다. 딥러닝 알고리즘은 신경세포의 동작과 신호 전달 과정을 소프트웨어로 구현하는 방법이다. 우리 뇌는 신경세포(뉴런)들과 그것들을 연결하는 시냅스(연접체)들로 구성돼 있다.
딥러닝 알고리즘에선 신경 세포를 연결하는 시냅스를 통해 신호가 전달될 때 신호 전달 가중치를 둔다. 그리고 이 여러 개의 신호가 한 개의 신경세포에서 만나서 더해지는데, 이때 더한 값이 어느 임계함수 값을 넘으면 다음 신경세포로 그 신호가 전달된다.
이처럼 딥러닝 알고리즘에선 수 많은 가중치와 임계함수가 학습을 통해 정해진다. 바로 이 가중치와 임계함수 값의 결정을 한 학습에는 데이터가 필요한데, 기존에 데이터 센터에 저장된 빅데이터를 이용하는 방법이 있고, 인공지능 스스로 데이터를 만들어 컴퓨터 스스로 자가 학습하는 '강화 학습 방법'이 있다. 그런데 바로 이 자가 학습은 인간의 도움이 필요 없기 때문에 더 무섭기도 하다.
딥러닝 알고리즘을 쉽게 개념적으로 설명하는 방법으로 러시아 생리학자 이반 페트로비치 파블로프가 실시한 '파블로프의 개' 실험을 예로 들기도 한다. '바블로프의 개' 실험은 반사 신경 작동에 대해서 연구한 내용으로 교과서에도 나올 정도로 유명하다. 이 실험에서는 음식을 직접 눈 앞에 보여 주거나 종소리를 들려 주면서 학습을 하게 된다. 눈으로 보는 음식, 귀로 들리는 종소리가 학습용 데이터가 된다.
눈으로도 보고 또는 종도 치면 그 합이 어느 임계함수 값을 넘으면 바로 개가 침을 흘리게 된다는 것인데 이것을 알고리즘으로 표현한 것이 딥 러닝이다. 그런데 이 가중치 값과 임계함수 값은 수많은 파블로프의 개 실험을 통해 학습으로 얻은 데이터로 정해진다.
'파블로프의 개' 실험을 이용한 딥러닝 프로세스. 출처 : KAIST. |
딥러닝은 깊은 추상화 과정
이처럼 딥러닝 알고리즘을 '파블로프의 개' 실험으로 설명하면 아주 단순하고 명료한 이해에 도움을 준다.
그런데 딥러닝 알고리즘에는 신경세포 층(Layer)으로 표현되는 추상화 단계가 있다. 이렇게 신경세포 층으로 표현되는 층수가 늘어날수록 판단의 정확도가 높아진다. 그 층 수가 200개를 넘기도 한다. 그래서 딥(Deep) 러닝이라고 한다. 층수가 늘어가면서 추상화의 깊이가 늘어난다. 입력이 영상 이미지라고 하면, 추상화를 진행하면서 처음에는 얼굴을 윤곽을 인식하게 되고, 그 다음에 코, 눈, 귀를 파악해 가고, 그 다음에 남녀를 파악하고, 나이도 파악하고, 궁극적으로 얼굴의 주인을 파악해 간다.
그러면 고양이와 호랑이도 구분할 수 있게 된다. 더 나아가 쌍둥이도 구별하고, 같은 사람이라도 젊었을 때의 모습, 나이든 모습도 구별하고 동일 인물임을 파악할 수 있다. 마지막에 100만 명 중의 또는 10억 중의 한 사람을 구분하게 된다. 여기에 음성 인식과 스토리 인식 기능, 감정 기능이 합쳐지면 영화도 보고 눈물을 흘릴 날이 멀지 않았다. 모두 딥러닝 알고리즘과 학습을 통해서 구현 가능하다.
딥 러닝을 이용한 영상 이미지 추상화 과정, 출처: KAIST. |
딥러닝, 인간의 '인지 기능의 비밀' 열어 젖힐 것
기존의 뇌 과학은 뇌 현상의 이해를 수학이나 논리 작업으로 파악하려고 했다. 그에 기반하여 알고리즘을 세우고 소프트웨어로 구현해서 인간지능을 재현하려 했다. 하지만 어느 이상 발전하는데 한계를 만났다.
그런데 딥러닝의 내부 동작은 블랙박스다. 여기서는 뇌 내부의 동작 원리를 알려고 하지 않는다. 아무리 빅데이터로 학습해서 가중치와 임계함수를 정해가더라도 그것들은 단순히 숫자의 나열일 뿐이지 논리도 없고 의미도 없다. 알려고도 하려고도 않는다. 빅데이터를 기반으로 학습해서 변수와 함수 값을 채워나갈 뿐이다. 그 이후 충분한 학습 후에 딥러닝 알고리즘이 제공하는 판단과 예측 결과만 믿을뿐이다.
이렇게 모든 것을 기존의 연구 방법론을 포기하고, 비우고, 새 출발하기 때문에 인공지능이 이제 신의 영역에 도달할 수 있는 새로운 기회를 잡았는지도 모른다. 과학의 한계를 인정하고, 빅데이터를 기반한 학습을 믿고, 컴퓨터의 능력을 믿기 때문이다. 완전히 새로운 출발이다.
블랙박스의 개념도. 출처 : 구글. |
[김정호 카이스트 전기 및 전자공학과 교수]
김정호 교수 |