2011년 SK플래닛 합류 후 이미지 인식 기술 프로젝트 개시
작년 11번가에 베타 서비스 시작.."경쟁 오프마켓과 차별화"
이미지 인식 알고리즘 개발 끝냈다.."내년 상반기 정식 서비스 계획"
[뉴스핌=이수경 기자] "지금까지는 '기장이 길고 단추가 달린 가디건'을 검색해도 찾을 수 없었다. 사람이 생각하는 이미지 특징을 몇 가지 단어로 정립할 수 없었기 때문이다. 사람이 이미지를 인식하는 방식을 모방한 딥러닝을 활용한다면 커머스 플랫폼이 가진 키워드 검색 한계를 넘어설 것이다."
전병기 SK플래닛 머신인텔리전스랩(M-I Lab)장은 지난 3일 뉴스핌과의 인터뷰에서 "현재 내부적으로는 이미지 인식 알고리즘 자체 개발이 어느 정도 완료한 상태"라며 "알고리즘을 적용하는 상품 카테고리 확장과 QA(품질검사)를 거쳐 내년 상반기 서비스를 정식 상용화를 준비중"이라고 말했다.
전병기 SK플래닛 머신인텔리전스랩(M-I Lab)장. <사진=SK플래닛> |
전 랩장은 포항공과대학교 전기전자공학과 컴퓨터 비전/영상처리 박사 과정을 전공했다. 이후 삼성전자 차세대단말팀 책임연구원으로 2년간 근무하며 엔비디아와 함께 3D 런처 개발 프로젝트 등을 진행했다. 이후 SK텔레콤 미디어 기술팀 매니저를 거쳐 SK플래닛 분사와 동시에 이미지프로세싱 팀으로 배치되며 본격적으로 이미지 인식 관련 업무를 시작했다.
SK플래닛에서 이미지 검색을 개발한 시기는 2012년부터다. 캐나다 토론토대학의 알렉스 크리제브스키가 그래픽처리장치(GPU) 기반 딥러닝 기술을 가지고 이미지넷(ImageNet)에서 1위를 거머쥔 해이기도 하다. 이미지넷은 1000개가 넘는 카테고리로 분류된 100만개의 이미지 인식 정확도를 겨루는 대회다.
알렉스 크리제브스키의 기술은 75%를 넘지 못했던 종전의 이미지 인식 정확도를 85% 가까이 끌어올렸다. 인간의 뇌 구조를 본딴 인공신경망 모델인 나선형 신경망(Convolution Neural Network, CNN)을 이용해 '알렉스넷'이라는 심층 신경망(Deep Neural Network)을 구현하고, GPU를 활용해 수많은 이미지 인식 훈련을 실시했다.
최근 열린 2015년 경진대회에서는 마이크로소프트팀이 96%가 넘는 정확도를 기록, 이미지 인식 능력은 인간과 동등한 수준으로 도달했다는 것이 전문가들의 평가다.
SK플래닛에서도 이와 비슷한 딥러닝을 활용하면서 이미지 인식 기술의 상용화 시기를 앞당겨 왔다. 현재 SK플래닛 CTO 조직에서 M-I랩이 알고리즘 개발 및 평가를 담당하고 있다.
지난해 1년간 SK플래닛은 티셔츠, 스커츠, 각 카테고리별로 속성을 미리 정의한 것을 토대로 100만장에 이르는 학습 데이트베이스(DB)를 구축했다. 전 랩장은 "11번가에서 사용자가 입력한 검색 질의어, 패션MD와 학계 전문가들의 조언을 기반으로 패션 아이템에 필요한 속성을 정의하는 작업(레이블링)을 진행했다"고 설명했다.
예를 들어 같은 가디건이라도 슬리브(소매)가 있는지, 단추가 있는지, 기장이 긴지 아닌지에 따라 서로 다르다고 인식해야 하기 때문이다. 전 랩장은 "기계학습에서 가장 중요한 것은 무엇을 학습하느냐다"며 "학습 데이터 셋(Set) 구축은 11번가의 경쟁력이자 차별점이라고 본다"고 덧붙였다.
<사진=SK플래닛> |
이렇게 개발한 이미지 인식 기술은 지난해 말 11번가 모바일 앱에 2가지 형태로 베타 서비스되고 있다. 하나는 11번가에 등록된 350만 장의 상품 이미지를 분석, 사용자가 찍은 사진과 유사한 상품을 고객에게 추천해주는 '유사 스타일 검색’이다. 현재는 사용자가 상의, 하의, 원피스, 신발, 가계 등 5개 카테고리 중 하나를 지정해야 한다. 향후 업데이트 버전에서는 사진을 찍으면 자동으로 속성을 인식하게 될 전망이다.
또하나는 이미 11번가 소호(SOHO, 1~10명 정도가 근무하는 작은 회사)몰 카테고리 등록된 상품 이미지 중 비슷한 스타일을 찾아주는 기능이다. 다만 현재 버전에서는 이미지 기술이 아주 일부만 적용돼 있다. 내년 1월까지는 내부 성능평가를 거쳐 브랜드 패션 등으로 확장한다는 계획이다.
전 랩장은 "11번가가 가지고 있는 전체 이미지 DB가 1000만장이라고 했을 때 소호몰에 업로드된 이미지 수는 극히 적다. 그렇다 보니 우리가 가진 알고리즘으로 학습하면 검색 후보군이 없는 경우도 많다"며 "유사 검색 조건을 간략화한 버전을 통해 사용자 반응을 테스트 후 다른 상품군에서 점진적으로 확대할 것"이라고 말했다.
[뉴스핌 Newspim] 이수경 기자 (sophie@newspim.com)