전체기사 최신뉴스 GAM
KYD 디데이
산업 생활경제

속보

더보기

[김정호의 4차혁명 오딧세이] 인공지능은 강아지와 고양이를 어떻게 구분할까?

기사입력 :

최종수정 :

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

알고보면 흥미로운 선형대수(linear algebra. 線型代數)

보통 고등학교 때 처음 수학 ‘행렬’을 배운다. 행렬은 다차원적인 숫자의 나열로 2차원인 경우 '(x,y)'로 표현된다. 대부분의 고등학교 수학처럼 왜 배워야 하는지, 어디 쓰는지 그때 알기 어렵다. 그런데 이 행렬 수학이 ‘인공지능 컴퓨터 계산’의 핵심 방법이다.

김정호 카이스트 교수

필자는 대학 2학년때 ‘선형 대수학’이라는 수학과목을 수강했다. 행렬의 수학적 의미와 원리를 배운다. 이 과목은 필자가 대학 때 공부한 과목 중에 가장 감동적이고 재미가 있었다. 수학 논리 전개의 아름다움을 깊이 느끼는 계기가 됐기 때문이다. 전기공학이나, 전자 공학, 전산 과목 또는 물리학 과목이 아니라 ‘수학과목’이었던 기억이 흥미롭고 그 중에서도 선형대수학이라는 과목이라는 점도 지금도 신기하다.

선형대수학에서는 벡터에서 출발해서 행렬의 정의하고 행렬의 기본이 되는 원리들을 순서대로 제시하고 증명한다. 행렬 속의 각 열 벡터가 서로 상호 의존적인가 독립적인가 논의한다. 서로 선형적이면 종속적이고 비선형적이면 독립적이다. 각 열 벡터가 독립적 벡터로 이루어진 행렬은 역행렬이 존재하고 구할 수 있다. 역행렬이 존재하는 행렬은 그 벡터들을 더하고 곱해서 변형하면 대각행렬(Diagonal Matrix, 대각선 부분 숫자만 있고 나머지는 모두 ‘0’인 행렬)가 될 수 있다.

선형대수 과목에서는 이러한 이론들을 처음부터 끝까지 200 여 페이지 책에서 순서대로 빈틈없이 증명한다. 처음부터 끝까지 한 개의 논리적 오점 없이 전체를 증명하고 전개해 간다. 이러한 논리의 완결성이 눈부시기까지 하다. 완벽하게 논리적이다.

행렬의 구성과 곱셈 공식. [출처: 정보통신 기술용어해설]
대각행렬의 구성과 조건. [출처: 정보통신 기술용어해설]

 

강아지와 고양이를 구분하게 해주는 'CNN 알고리즘'


요즈음 행렬 계산이 공학적으로 더욱 중요해 지고 있다. 모든 빅데이터가 디지털로 기록되기 때문이다.

그 중에서도 데이터의 깊이가 크고 정보량이 많은 데이터가 영상 이미지이다. 카메라에서 얻은 이미지는 카메라 센서가 2차원 평면 배열로 되어 있다. 이 배열 자체가 (x,y) 2차원이다. 여기에 색깔 정보, 밝기 정보, 빛의 세기 정보가 더해지면 N 차원 정보가 되고 이를 수학적으로 표시하면 N 차원 행렬이 된다. 그래서 유튜브의 사용이 더욱 확대되면 행렬 계산양도 늘어난다.

인공지능 딥러닝 알고리즘 중에서 영상 이미지 판독에 가장 유효하게 쓰이는 방법이 CNN(Convolution Neural Network) 이라는 알고리즘이다. CNN 에는 여러 개의 신경망 층으로 이루어져 있다. 쉽게 이야기해서 CNN 입력으로 사진이 들어가면 CNN이 강아지인지, 고양이 인지, 곰인지, 사슴인지 찾아 낸다.

그런데 이 CNN 에서 여러 개의 신경망 층(Layer)을 지나면서 각 층의 출력이 단순화되고 추상화 되어 나간다. 이러한 과정을 거치면서 입력이 수천 다차원 행렬이라 하더라도 최종 출력은 ‘동물의 이름’이 되기 때문이다. 이렇게 크기가 큰 행렬을 줄여나가는 과정을 수학적으로 함수 합성곱(Convolution) 이라고 한다. 이 과정은 수식적으로 볼 때 크기가 큰 행렬에 작은 크기의 행렬을 계속 곱해서 얻는다.

이 곱하는 작은 행렬을 필터 행렬이라고 한다. 이렇게 되면 각 신경망 층이 추상화(Abstraction) 과정을 하게 된다. 첫 층의 입력이 사진이라면 2층은 윤곽을 표현하고, 3층은 코, 입, 귀를 판단하고, 뒷 부분 층은 남녀 인종 등을 파악하고 최종적으로 누구인지 파악하는 과정을 거친다. 이처럼 CNN 에서도 학습과정에서 계속해서 행렬 연산이 이루어져 있다.

사진과 영상 분석에 유용한 인공지능 알고리즘인 CNN의 구성도. [출처: Intel]

행렬과 텐서

그러니 인공지능을 위한 프로그램을 만들기 위해 소프트웨어 코딩을 한다는 것은 수많은 행렬연산을 계획된 순서대로 짜는 것과 같다. 특히 인공지능의 학습과정과 ‘판단(Decision)’ 혹은 ‘추론(Inference)’을 내릴 때 수 많은 행렬 연산을 한다. 그래서 인공지능을 연구하고 개발한다는 의미는 행렬 연산에 묻혀 사는 것과 같다.

이처럼 다차원 행렬을 수학에서 텐서(Tensor)라고 부른다. 그러므로 스칼라(Scalar)는 ‘0 텐서’, 벡터(Vector)는 ‘1 텐서’, 행렬은 ‘2 텐서’라고 부르기도 한다. 구글에서 제공하는 인공지능 계산 플랫폼을 텐서 플로우(Tensor Flow) 라고 부르는 것이 이런 배경이 된다. 인공지능에서 다 차원 행렬인 텐서 계산이 딥러닝 층을 지나가면서 쭉 흘러간다. 이 수학적인 과정이 학습과 판단 과정이다.

재미있는 드라마에는 ‘암시’를 주고 되살아나는 과정이 있으며, 이 과정이 드라마의 재미를 더해 준다. 암시는 장면, 만남, 표정, 대사에서 다양하게 나타난다. 특히 드라마 초반에 나타나 미래 전개 과정을 암시한다. 필자가 대학 2학년 때 선형대수 과목에 푹 빠졌던 것은 40년 후 다가올 4차 산업혁명 시대와 인공지능 시대를 암시했는지도 모른다.

구글의 오픈소스 인공지능 플랫폼 텐서 플로우, [출처: Data Flair]

 

 

joungho@kaist.ac.kr


[김정호 카이스트 전기 및 전자공학과 교수]

[관련키워드]

[뉴스핌 베스트 기사]

사진
국정원 "로저스 대표 위증 고발 요청" [서울=뉴스핌] 조민교 기자 = 국가정보원(이하 국정원)이 해럴드 로저스 쿠팡 대표를 위증 혐의로 고발한다는 의견을 밝혔다.  30일 국회 과학기술정보방송통신위원회 위원장인 최민희 더불어민주당 의원은 청문회 도중 "국정원이 오늘 청문회를 모니터링하던 중, 청문회를 지켜보던 국정원장이 로저스 대표를 위증죄로 고발해 달라고 과방위에 요청할 계획이라는 입장을 전달해 왔다"며 "구체적인 위증 내용도 함께 전달받았다"고 말했다. 이어 "해당 사안은 간사에게 전달해 내일 청문회 종료 시점에 처리하겠다"고 밝혔다. [서울=뉴스핌] 윤창빈 기자 = 해롤드 로저스 쿠팡 임시 대표가 30일 서울 여의도 국회 과학기술정보방송통신위원회 전체회의에서 열린쿠팡 침해사고 및 개인정보 유출, 불공정 거래, 노동환경 실태 파악과 재발방지 대책 마련을 위한 청문회에서 의원 질문에 답변하고 있다. 2025.12.30 pangbin@newspim.com 로저스 대표는 이날 청문회에서 쿠팡이 정부 및 수사기관을 거치지 않고 정보 유출자를 접촉했다는 의혹과 관련해 "저희는 피의자와 연락하는 것을 원치 않았지만 여러 차례에 걸쳐 그 기관(국가정보원)에서 피의자와 연락하라는 요청을 받았다"고 말했다. 이어 '명확한 지시나 명령이 있었느냐'는 추가 질의에는 "명령이었다. 지시 명령"이라고 주장했다. '국정원 누구와 소통했느냐'는 질문에 대해서는 "현재 이름은 없지만 해당 이름을 전달하겠다"고 답했다. 로저스 대표는 해킹에 사용된 장비의 포렌식과 관련해서도 "정보기관이 복사본을 보유하고 있고, 원본은 경찰에 전달했다"며 "그 기관이 별도의 카피를 만들어 우리가 보관하는 것도 허락했다"고 말했다. 또 '셀프 면죄부 조사 아니냐'는 지적에는 "정부 지시에 따라 한 조사"라며 "이사회도 한국 법에 따라 협력해야 한다고 판단했다"고 밝혔다. 그러나 정부 측은 로저스 대표의 주장과 선을 긋고 있다. 배경훈 부총리 겸 과학기술정보통신부 장관은 이날 청문회에서 "포렌식 검사와 로그 분석의 주체는 과기정통부가 주관하는 민관합동조사단과 개인정보보호위원회, 경찰청"이라며 "국정원이 지시하거나 조사를 주도한 사실은 없다"고 밝혔다. 배 부총리는 "국정원은 증거물을 국내로 반입하는 과정에서 훼손이나 분실을 방지하기 위한 기술적 지원을 한 것으로 안다"며 "이를 조사 지시나 개입으로 볼 수는 없다"고 설명했다. 국정원도 별도의 입장을 내고 로저스 대표의 발언을 부인했다. 국정원은 지난 26일 공지를 통해 "쿠팡 사태와 관련해 국정원은 쿠팡 측에 어떠한 지시를 할 위치에 있지 않으며, 어떠한 지시를 한 바도 없다"고 밝혔다. 다만 "외국인에 의한 대규모 정보 유출 사태를 국가안보 위협 상황으로 인식해, 관련 정보 수집·분석을 위한 업무 협의를 진행한 바는 있다"고 설명했다. mkyo@newspim.com 2025-12-30 18:00
사진
이혜훈 "내란은 민주주의 파괴" [서울=뉴스핌] 양윤모 기자 = 초대 기획예산처 장관 후보자로 지명된 이혜훈 전 국민의힘 의원이 30일 오전 서울 중구 예금보험공사에 마련된 인사청문회 준비 사무실로 출근하며 "내란은 민주주의 파괴하는 일이며 실체파악 잘 못했다"라며 사과문을 발표하고 있다. 2025.12.30 yym58@newspim.com   2025-12-30 10:27
기사 번역
결과물 출력을 준비하고 있어요.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동