전체기사 최신뉴스 GAM
KYD 디데이

[AI로 가는 길, 데이터댐의 명암④] 이성 디다이브 CTO "언어·시각·수치 데이터 최적화 모델 선택과 집중해야"

기사입력 : 2021년05월04일 15:01

최종수정 : 2021년07월07일 17:59

정부 데이터댐 사업 백화점식 아닌 '선택과 집중' 절실
일자리 중심의 사업 아닌, 산업 활성화 방향 추진해야

[세종=뉴스핌] 이경태 기자 = 인공지능(AI) 만능시대는 올까. 우선, 정부가 디지털 뉴딜을 선포하면서 AI 시대를 앞당기기 위한 정책 마련에 힘을 쏟고 있다. 이를 위한 초기 사업으로 공을 들이고 있는 것이 '데이터댐'이다. AI 산업에 필요한 데이터부터 구축해야 한다는 생각에서다.

하지만, 우려의 시선도 포착된다. 예전 정부 주도 사업이 그랬듯이, 시장 활성화를 기대하기 어려울 수 있다는 지적도 끊이질 않는다. 이성 디다이브 CTO는 지난달 30일 <뉴스핌>과의 인터뷰에서 정부의 데이터댐 정책에 대해 '선택과 집중'을 강조했다. 디다이브는 데이터기반의 퍼포먼스 마케팅 전문기업이다.

이성 디다이브 CTO [사진=디다이브] 2021.05.04 biggerthanseoul@newspim.com

이성 CTO는 "전시성이 아니라 실제로 언어지능, 시각지능, 수치 데이터를 최적화할 필요가 있다"며 "이같은 핵심 모델을 큰 스케일로 만들어야 하고, 이는 민간에서 할 수 없는 영역이다보니 정부가 해줘야 할 일"이라고 강조했다.

이 CTO는 "데이터를 얼마나 실용적으로 쓸 수 있는 지를 살펴야 한다"며 "데이터가 구축된 이후에 이를 활용하고 업데이트하고 부가가치를 만들어내는 서비스를 만드는 데 목표를 둬야 한다"고 말했다.

오히려 단기 일자리 창출에 초점이 맞춰진 것은 아니냐는 게 이 CTO의 지적이기도 하다. 그는 "현재 데이터 라벨링 작업은 단순 업무여서 특별한 기술이 없어도 누구든지 할 수 있다"며 "이후 빅데이터를 활용해 사업화가 다각화될 수 있도록 해야 한다"고 말했다. 고급 인재를 키워내는 교육과 전문훈련 등이 필요하다는 게 이 CTO의 조언이다.

이성 CTO는 "이번 사업에서 데이터가 계속 가치있게 활용되도록 하려면 최신데이터를 유지해야 한다"며 "시장은 끊임없이 변하고 있는데, 빠른 시장 변화의 속도에 맞는 신속하고 변형된 데이터를 구축해야 산업이 보다 활성화될 것"이라고 덧붙였다.

다음은 이성 디다이브 CTO와의 인터뷰 일문일답. 

-정부의 데이터댐 정책에 대해 어떻게 보고 있나

▲방향은 잘 잡았다. 그런데 실제로 실무적으로 들어가서 데이터를 얼마나 실용적으로 쓸 수 있을 것인가 하는 것은 의문이다. 관련된 사업에 참여하려고 준비를 하기도 했다. 일단은 사업 자체가 인력을 많이 투입을 해서 일자리를 창출하려는 데 집중이 된 듯하다. 데이터가 구축된 이후에 그것을 활용하고 업데이트하고 부가가치를 만들어내는 서비스를 만드는 게 궁극적 목적인데, 일자리에 치우친 듯하다. 취지는 좋다. 데이터댐이 어떻게든 구축이 되면, 그 기반으로 활용하는 서비스는 나올 수 있을 것이다. 그렇게 하기 위해서는 보완돼야 할 것도 많다. 학습용 AI 데이터를 170종으로 구분한 것 자체가 학계나 연구소 단위에서 나오다보니, 실제로 서비스로 나오려면 현재보다는 유연해야 한다. 데이터 자체가 계속 업데이트가 돼야 한다. 업데이트 계획은 안보인다. 현장에서 실제로 활용하고 적용가능한 데이터로 채워져야 하는데, 초기니깐 개선될 수 있다고 본다. 활용에 대한 가이드라인이라던지 구축 자체에 대한 의견을 받아서 데이터 카테고리를 설정해야 할 것으로 본다.

-정부가 이달에 데이터댐의 수문을 연다. IT 업계의 기대치는 어느 정도일 지 궁금하다

▲대부분이 데이터 기반으로 사업을 시작하려는 스타트업일 것이다. 데이터 자체가 없다보니 데이터댐을 통해 프로토타입을 만들어내는 수준은 되리라 본다. 실제로 산업에서 경쟁력있게 쓸 수 있는 수준은 안된다. 데이터로 컨셉을 만들고 실제 서비스화하기 위해서 실제 라이브 데이터, 현장에서 많이 쓰는 데이터가 꾸준히 업데이트돼야 한다. 업체에서 결국 해결할 수 밖에 없는 상황이라 그런 부분은 한계가 있다. 산업군 별로 데이터를 구축하는 것은 좋은데, 데이터를 기존 과거의 데이터 방식으로 구축하다보니 활용이 제한적이다. 구축해놓은 데이터를 보면, 인물 데이터나 지명 데이터의 경우, 이를 통해 실제 서비스로 적용하기에는 어려워 보인다. 실제로 서비스하기에는 부족한 게 많다. 결국에는 산업계 입장에서 볼 때는 여러 종류의 데이터를 가지고 테스트하는 테스트 베드 정도이고 실제 서비스를 하려면 데이터를 다시 구축해야 할 것 같다. 예를 들어 핀테크에 적용할 경우, 개인 금융 정보를 다른 서비스로 옮길 수 있다. 다만, 이용자의 최근 한달, 일주일에 쓴 데이터로 최적화해야 하는데, 그런 부분이 부족하다보니 활용도 측면에서 떨어질 수 있다.

-중견·중소기업, 스타트업이 이같은 데이터댐을 어떻게 활용하면 좋은가.

▲다양한 사업모델에 필요한 초기 데이터를 구축하는 데 비용이 들기 마련이다. 데이터댐에 구축된 데이터를 가지고 중소기업이나 스타트업이 서비스에 대한 콘셉트를 증명해주는 정도로 활용해볼 수 있을 것이다. 어느 정도 시장에서의 반응도 있겠다 싶다면, 그것으로 투자자를 모집하거나 정부지원 사업으로 자금을 수혈해 본 서비스 만들 때 시험모델 만들 수 있는 초기 데이터로 활용이 가능할 것이다. 그런 데이터가 계속 가치있게 활용되도록 하려면 최신데이터를 유지해야 한다. 다만, 그런 계획은 안보인다. 시장은 끊임없이 변하고 있는데, 빠른 시장 변화의 속도에 맞는 신속하고 변형된 데이터를 구축하지 않으면 안된다. 카드사도 카드 데이터를 판매한다. 다만, 이마저도 1~2년전 데이터다. 빠르게 바뀌는 트렌드를 뒤따라가기에는 한계가 있다. 이미지 데이터 등도 변하는데 지속적으로 유지보수를 관리할 수 있는 모델로 데이터를 구축해야 한다.

-데이터댐 사업을 통해 오는 2025년까지 1300종의 데이터를 정부가 내놓는다고 하는데, 어떻게 보는가

▲종류별로 구색을 갖추려고 하는 것 같다. 지금 구축된 것도 상용화해서 쓸 수 있는 데이터는 몇 개 안된다. 백화점식 진열보다는 오픈 API 방식으로 집중된 대용량 모델을 활용할 수 있도록 해야 한다. 전시성이 아니라 실제로 언어지능, 시각지능, 수치 데이터를 최적화할 필요가 있다. 그런 핵심 모델을 큰 스케일로 만들어야 한다. 이는 민간에서 할 수 없는 영역이다보니 정부가 해줘야 할 일이다.  그런 모델을 제대로 만들어야 한다. 실제 미국이 앞서간다고 본다. 몇십 억개의 파라미터가 들어가 다양한 서비스로 확대될 수 있도록 하는 게 중요하다.

-데이터 수집 및 가공 부문에서 정부가 일단 라벨링 등으로 일자리를 창출한다. 실제 일자리를 창출하려면 어떤식으로 해야 할까

▲데이터 라벨링은 단순 업무다. 특별한 기술이 없어도 누구든지 할 수가 있다. 전문 지식이 없어도 할 수 있는 일인 것이다. 그 부분도 데이터가 쌓이고 자동화가 되면 필요없는 영역이 될 것이다. 초기 단계에서 일자리 창출을 위해서 하는 것은 괜찮은데 부가가치가 있는 일은 아니다. 한계가 있다. 이후 빅데이터를 활용하는 것은 고급인재가 할 수 있는 일이다. 교육, 직업훈련이 중요하다. 이런 부분에서 인재를 양성하는 게 중요하다. 최근 상황을 보면, 일자리가 IT 분야에서 늘어나고 다른 분야에서 줄어드는 분위기다. 뿐만 아니라 IT업계의 면접 지원자를 보면 관련 전공자들이 드물다는 점도 잘 살펴야 한다. 대부분 비전공자가 학원에서 배워서 온다. 이런 사회적인 전환이 이뤄지고 있다. 학과간 연계를 해 인공지능을 활용해서 발전시킬 수 있도록 커리큘럼도 다양해져야 할 것이다.

-정부 정책의 방향성에 대한 바라는 점은 무엇인가

정부가 지원사업을 활발하게 하고 있다. 다만, 결국 관건은 데이터댐 사업에서도 옥석을 가려내야 하는 데 있다. 간섭은 줄이고 성장 가능성이 높은 분야에 집중적으로 지원해 성과도 함께 창출하면 좋을 것 같다. 성공하는 기업을 만들거나 서비스를 만들면 기업에서 일자리가 생긴다. 단기성 일자리를 늘리는 것은 말 그대로 단기적인 것이다. 질 좋은 일자리를 만드는 것이 현재 필요할 때다.  

◆ 이성 디다이브 CTO 프로필

-전 모바일 게임 개발사 인큐브 대표
-전 Naver 전사 프로젝트 총괄 관리
-전 SK Communications 글로벌 싸이월드 설계·개발

biggerthanseoul@newspim.com

[뉴스핌 베스트 기사]

사진
다음달 10일 2차 소비쿠폰 기준 나온다 [세종=뉴스핌] 양가희 기자 = 행정안전부가 2차 민생회복 소비쿠폰 지급기준을 이르면 내달 초 발표할 예정이다. 상위 10% 구분 기준은 부동산 및 금융소득 등을 살펴 이달 중 기준 수립 준비에 나선다. 한순기 행안부 지방재정경제실장은 8일 정부세종청사 행정안전부에서 열린 민생회복 소비쿠폰 간담회에서 "9월 10일 정도에 2차 (소비쿠폰) 기준을 발표할 것"이라고 밝혔다.  한 실장에 따르면 2차 지급 기준 준비는 이달 중 시작된다. 그는 "보건복지부와 건강보험공단을 만나 기준을 짜야 한다"며 "2021년 사례를 보면 1인가구는 특례를 가산했고, 맞벌이가구는 뺐다"고 설명했다. [서울=뉴스핌] 류기찬 인턴기자 = 한국신용데이터(KCD)가 4일 민생회복 소비쿠폰 카드 매출 분석 결과를 공개했다. 민생회복 소비쿠폰 지급이 시작된 지난 21일부터 27일까지 자영업자 매출 증감률은 전주 대비 평균 2.2% 증가한 것으로 나타났다. 이날 오후 서울 시내의 한 매장에 민생회복 소비쿠폰 사용가능 안내문이 붙어있다. 2025.08.04 ryuchan0925@newspim.com 한 실장은 "고액 자산가인데 건보료만 적게 내는 경우도 있다"며 "(행안부의) 부동산 데이터나 국세청 금융소득 데이터를 활용해 직장 가입자 중 고액 자산가를 선별할 것"이라고 덧붙였다. 지난달 21일부터 이달 7일까지 소비쿠폰 지급 현황에 따르면 전체 신청자는 4818만명으로, 전체 지급대상자의 95.2%가 신청을 마쳤다. 지급액은 8조7232억원으로 집계됐다.  사용 현황은 신용·체크카드 지급액 5조8608억원 가운데 절반가량인 3조404억원(51.9%)이 소비됐다. 이날 처음 공개된 지역별 신용·체크카드 소비율을 보면 서울보다 지역이 높은 편이었다. 제주가 57.2%로 가장 높았고 이어 인천 54.7%, 울산 54.6%, 광주 54.5%, 충북 54.1%, 대전 54.0%, 부산 53.7% 등이었다. 한 실장은 "비수도권에 3만원·5만원 더 준 부분도 있지만, 지역 영세소상공인 매출로 이어져 의미 있는 숫자"라며 "10%포인트(p) 차이는 아니지만 2~3%p라도 높은 것은 그만큼 비수도권이 어려웠다는 방증이자 (소비쿠폰이) 사용되고 있다는 신호"라고 말했다. 행안부는 2차 소비쿠폰 지급을 위한 예산에는 문제가 없다는 입장이다. 한 실장은 "사업 전체 13조9000억원 가운데 1조8000억원만 지방(예산)이고 나머지 12조1000억원가량이 국비다"라며 "(국비에서) 8조1000억원을 먼저 내렸고, 기획재정부 협조를 구해 이달 중순 정도에 4조1000억원을 조속하게 받기로 했다"고 말했다. [자료=행정안전부] 2025.08.08 sheep@newspim.com 한 실장은 "(소비쿠폰 2차 지급에 앞서) 지방채 발행이 필요 충분 조건은 아니고 충분조건 정도 될 것"이라며 "(지방재정법 통과는) 9월 본회의까지 하도록 목표를 잡고 있다"고 덧붙였다. 이번 추가경정예산안(추경)에는 민생쿠폰 관련 연구용역 예산 2억원도 담겼다. 소비쿠폰 등 현금성 지원에 대한 효과를 철저하게 분석한다는 취지다. 한 실장은 "민생쿠폰 추경에 연구용역비 2억원이 담겼다"며 "과거 2020~2021년 효과가 있냐 없냐 등 많은 비판이 있었다. 연구 용역을 제대로 하려는 것"이라고 설명했다. 조세정책연구원이나 KDI 등과 연구한다는 것이 행안부 현재 계획이다. 행안부는 하나로마트에서 사용할 수 있는 지역을 확대한다는 계획도 이날 밝혔다. 그간 도서산간지역 소비쿠폰 사용처가 제한적이라는 비판이 꾸준히 제기된데 따른 것이다.  한 실장은 "면 단위에서 동네에 마트 등이 전혀 없는 경우가 있어 하나로마트 121곳에서 현재 사용 가능하다"면서도 "현장을 가 보니 마트가 있어도 너무 영세해 고기나 채소 등 신선식품을 사기 어려운 경우가 있었다. 현재 시장·군수 대상으로 수요조사를 하고 있고, 빠른 시일 내로 하나로마트 사용처를 추가 지정할 것"이라고 말했다. 한 실장은 또 "추가 소비 진작 대책을 관계부처와 많이 만들고 있다"며 "행안부는 수도권 기업, 공기업, 관공서 등과 비수도권 간 자매결연을 맺는 소비진작 대책을 만들고 있다"고 밝혔다. sheep@newspim.com 2025-08-08 16:11
사진
주담대 이어 전세대출 문턱 높인다 [서울=뉴스핌] 정영희 기자 = 정부의 고강도 대출규제에 은행권 또한 전세대출 문턱을 높이고 있다. 가계대출 감축 취지에 발맞춘 조치이지만 서민 실수요자의 주거 사다리가 점점 짧아질 수 있다는 비판도 덩달아 커지는 모습이다. 최근 1년간 서울 아파트 전세 거래량 변동 추이 [그래픽=김아랑 미술기자] ◆ 대출 안 내준단 은행에… 집주인·세입자 모두 '망연자실' 8일 금융권은 이번 주부터 전국 단위로 조건부 전세대출 취급 제한을 확대했다. 신한은행은 지난 6일부터 10월까지 임대인 소유권 이전이나 보유 주택 처분을 조건으로 한 전세대출을 막기로 했다. 집주인이 기존에 갖고 있던 근저당을 말소하는 대신 나오는 전세대출도 마찬가지다. 본래 수도권을 대상으로만 금지했으나 이를 전국으로 확대한다. 하나은행은 이달 5일부터 9월 실행 예정인 전세대출의 신규 신청을 받지 않기로 했다. NH농협은행도 비슷한 상황이다. IBK기업은행은 이보다 하루 빠른 이달 4일부터 대출 모집인을 통한 전세대출 추가 접수를 전면 중단했다. 정부는 지난 6월 27일 수도권·규제지역의 '가계부채 관리 강화 방안'을 발표하며 가계대출 조이기에 나섰다. 같은 달 28일부터 수도권 내 주택담보대출 한도를 6억원 이하로 제한하고 다주택자의 추가 주택구입 대출을 전면 금지했다. 세입자가 전세자금대출을 받는 날 해당 주택 소유권을 이전하는 것을 조건으로 하는 소유권 이전 조건부 전세대출도 불가하다. 이와 함께 하반기 은행권 가계대출 증가 목표치를 기존의 절반으로 줄였다. 5대 은행(국민·신한·하나·우리·농협)은 가계대출 증가액 목표치를 7조2000억원에서 3조6000억원으로 축소했다. 지난달 가계대출 증가액은 4조1386억원으로 전월(6조7536억원)보다 38.7% 줄었다. 갭투자를 차단하겠다는 명목이지만 당장 자금 조달에 차질이 생기면서 전세 입주를 앞둔 이들은 발등에 불이 떨어졌다. 수중에 돈이 없는데 은행 대출 문까지 막히면서 입주를 못 하는 일이 벌어지고 있어서다. 대출이 많이 껴있는 집이나 주택 여러 채를 소유한 임대인의 집에 들어가려면 대출이 나오지 않을 수 있다.  전세 매물도 감소세다. 전세계약 만료를 앞둔 집주인도 대출이 안 나와 보증금 반환이 어려워지자 세입자를 받는 대신 직접 입주를 선택하는 일이 늘었다. 부동산 빅데이터업체 '아실'에 따르면 6일 기준 서울 아파트 전세 매물은 2만3467건으로 전년 동기(2만6512건) 대비 11.5% 감소했다.  거래량도 내리막길을 걷고 있다. 서울부동산정보광장에 따르면 지난달 서울 아파트 전세 거래량은 9546건으로 전월(1만2120건) 대비 21% 줄었다. 수요는 많은데 매물은 줄어들면서 가격은 상승세다. 지난달 서울 아파트 중위 전세가격은 평균 5억6333만원으로 한 달 사이 333만원 올랐다. 전년 동기(5억 3167만 원)와 비교하면 6.0% 뛰었다. ◆ "돈도 매물도 없다" 갈 곳 없는 세입자, 월세로 눈 돌려 6.27 대출규제에 정책대출 감축 내용도 포함되며 전셋값 상승 압력을 더욱 키울 수 있다는 분석이 나온다. 서민 주거 안정을 위해 지원되던 청년·신혼부부·신생아 버팀목 전세대출의 한도도 줄었다. 상품에 따라 상한선이 최소 4000만원에서 많게는 6000만원까지 내려오면서, 이를 통해 보증금을 마련하려던 예비 세입자들의 부담이 커지게 됐다. 이재윤 집토스 대표는 "2년 전보다 전세가가 하락해 보증금 반환에 어려움을 겪고 있는 일부 집주인 입장에선 이번 규제가 전세 보증금 반환 리스크를 더욱 가중시키는 또 다른 변수로 다가올 것"이라고 말했다. 양지영 신한 프리미어 패스파인터 전문위원 "정책대출이 줄어들면 장기 저리 대출 수단이 사라지면서 주거 사다리 형성이 더 어려워진다"며 "청년, 신혼부부 등 초기 자산 형성이 되지 않은 계층과 주택 구입이 더 멀어지며 임대시장으로 밀려나는 현상이 가속화될 것"이라고 설명했다. 무주택 실수요자는 전셋값이 오르고 자금줄은 막힌 이중고 속에서 집을 구하긴 해야 하니 반전세나 월세 등을 선택할 수밖에 없는 처지다. 국토교통부 실거래가 공개시스템에 따르면 지난달 서울에서 발생한 아파트 신규 임대차 계약 중 월세 비중은 42.2%(5555건 중 2345건)으로 전년 동기(41.5%)보다 0.7%p 증가했다. 이런 상황에서 국정기획위원회가 전세대출과 정책모기지에도 총부채원리금상환비율(DSR) 적용을 검토하겠다고 알려지며 우려가 더욱 커졌다. 전문가들은 대출 규제의 부작용을 해결할 추가 대책이 적절히 마련돼야 한다며 입을 모은다.  김인만 김인만경제연구소 소장은 "집값 급등의 원인이 되는 수급 불균형 문제 해결이나 세금 관련 규제 등을 통해 주택시장을 안정화하겠다는 메시지를 던질 시점"이라고 말했다. 김덕례 주택연구실장은 "이전 정부 경험에 비춰볼 때 이번 대출 규제 효과는 3∼6개월에 불과할 우려가 있다"며 "빠르고 강력한 공급 대책을 강구하지 않으면 눌려 있던 매매 수요가 저금리와 경기 활성화 분위기를 타고 다시 살아나면서 4분기 중 집값이 다시 급등세로 돌아설 가능성이 크다"고 말했다. chulsoofriend@newspim.com 2025-08-08 06:10
안다쇼핑
Top으로 이동