전체기사 최신뉴스 GAM
KYD 디데이
산업 ICT

속보

더보기

'데이터 댐' 프로젝트, 필요한 모든 곳에 데이터 보급된다

기사입력 : 2020년09월02일 15:56

최종수정 : 2020년09월02일 15:57

중소벤처도 AI 연구·개발 가능...AI 생태계 송두리째 바뀌어

[서울=뉴스핌] 김지완 기자 = 한국판 뉴딜 '데이터 댐' 프로젝트 본격 가동으로 대한민국 인공지능 연구·개발 판도가 바뀔 전망이다.

데이터를 독점한 소수기업만이 의미있는 인공지능(AI) 연구를 해왔던 것과 달리, 모든 기업들이 수준 높은 빅데이터를 활용해 인공지능 개발에 나설 수 있게 됐기 때문이다. 사실상 '데이터 민주화'가 이뤄진다고 볼 수 있다.

2일 과학기술정보통신부는 지난 7월 발표된 '디지털 뉴딜' 대표과제 '데이터 댐' 프로젝트의 7대 핵심사업들을 수행할 주요기업 등의 선정 작업을 마무리하고, 본격적으로 사업을 추진한다고 밝혔다. 올해 추경사업으로 4991억원이 투입되고, 총 2103개 기관이 지원 대상으로 확정됐다.

[서울=뉴스핌] 문재인 대통령이 18일 강원도 춘천, 빅데이터 플랫폼 운영기업인 더존비즈온을 방문해 직원들과 차담회를 하고 있다. [사진=청와대] 2020.06.18 photo@newspim.com

◆ 韓, 데이터 부족으로 디지털 전환 '걸림돌'

데이터를 댐에 갖힌 물에 비유한 이 사업은 거대한 댐에 데이터를 가득 채우는 것을 목적으로 하고 있다. 댐에 보관중인 물이 식수, 농업용수, 공업용수 등으로 다양하게 쓰이 듯 활용도 높은 데이터 확보가 사업 의의다.

데이터 댐은 데이터를 잘 보관하고 있다가 필요한 곳에 보내주는 역할을 한다. 이때 데이터를 보관하는 댐 역할을 하는 곳은 클라우드, 데이터 전송은 통신 네트워크, 데이터를 받아 활용하는 것이 인공지능이다. 

즉 디지털 전환은 데이터-네트워크-인공지능'으로 이어지는 삼격편대가 핵심이다. 우리의 경우 네트워크에선 5G 세계최초 상용화를 이뤘고, 인공지능 역시 양자, 모바일, 엣지, 클라우드 컴퓨팅에서 일정수준의 글로벌 역량을 보유했다고 평가받고 있다.

문제는 국내 데이터가 부실하다는 평가다. 네트워크와 인공지능은 일정 수준의 역량이 확보됐지만, 데이터가 부족해 디지털 전환에 걸림돌이 되고 있단 얘기다. 농사에 비유하자면 수로와 농업 기술은 뛰어나지만 농업용수 부족으로 농사 짓기가 원할하지 못한 상황이다.

영국 인디펜던트에 따르면, 지난해 12월 열린 GLUE(자연어 이해 평가, General Language Understanding Evaluation)대회에서 바이두의 AI 'ERNIE'가 90.1점을 기록해 MS(89.9점), 구글(89.7점)을 앞질렀다. GLUE는 AI 분야 언어 이해 능력을 측정하는 벤치마크(성과 평가 기준)로 널리 사용중이다. 

인공지능 후발주자인 중국이 구글·마이크로소프트(MS)를 제치고 세계 최고 수준의 인공지능 기술 국가가 된 배경엔 매일 5억명의 인구가 간편결제를 하며 쌓아놓은 엄청난 양의 데이터 때문이다.

구글 알파고로 유명한 미국도 간편결제 사용인구는 5000만명에 불과하다. 미국이 중국에 선두를 내 준건 데이터양에서의 차이가 크다는 분석이다. 아직까지 현금사회를 실천중인 일본은 4차산업 시대에선 명함조차 내밀지 못하고 있다. 온라인상에선 '잘사는 중세국가'라는 오명을 얻는 것도 바로 데이터 부족에 기인한다.

◆ AI연구, 부가가치 높은 양질의 데이터 필요

그간 대한민국은 데이터 부족 심각으로, 인공지능 후진국으로 전락할 수 있다는 경고가 이어졌다. 이에 학계에선 오래전부터 대한민국 인공지능 경쟁력 제고를 위해 'AI 학습용 데이터셋' 구축 필요성을 언급했다.

최준균 카이스트 전기전자공학과 교수는 "데이터가 없으면 인공지능은 소용이 없다"면서 "데이터가 있어야 인공지능이 돌아간다. 문제는 AI에서 가장 어려운 것이 데이터를 수집하는 것"이라고 설명했다.

이병태 카이스트 경영대학 교수는 "빅데이터가 없으면 인공지능 연구는 거의 불가능하다"머 "인공지능도 여러가지가 있는데, 기본적으로 빅데이터를 이용해 인공지능 알고리즘을 훈련시킨다. 데이터로부터 배우는데, 빅데이터가 없으면 인공지능 연구는 이론적으로는 가능하겠지만, 실용적인 인공지능은 불가능하다"고  목소리를 높였다.

[서울=뉴스핌] 김지완 기자 = 강도현 과학기술정보통신부 인공지능기반정책관이 2일 디지털 뉴딜 '데이터 댐' 프로젝트에 대해 과기정통부 청사에서 브리핑하고 있다. [사진=과기정통부] 2020.09.02 swiss2pac@newspim.com

부가가치가 높은 양질의 데이터 구축해야 한다고 강조했다.

최준균 교수는 "데이터가 잘못된 쓰레기 데이터가 섞여 수집되면 데이터 처리가 힘들어진다"며 "빅데이터가 좋은게 아니라, 정리가 안 된 빅데이터는 없는것보다 더 나쁘다. 더 헷갈리게 만들어 버리기 때문"이라며 데이터 수집·관리의 컨트롤 타워가 필요하다는 입장이다.

민·관·공의 융합데이터 확보가 데이터 선진국으로 가기 위한 구체적 방법론으로 제시했다. 

이병태 교수는 "데이터는 자기가 수집하는 것도 있고, 공공부문에 널려있는 것도 있을거고, 또 소비자로부터 돈을 써서 받을 수도 있다"면서 "같은 분야. 구글이나 네이버 처럼 검색 결과나 사람들이 뭘 사는지 알고있는 기업과 경쟁하기는 어렵지만, 인공지능 분야는 워낙 다양하다"고 진단했다.

이어 그는 "모든 분야에 많은 빅데이터를 갖고 있는 기업은 없다"며 "한 기업이 갖고 있는 데이터는 한계가 있다. 정부나 공공, 개인이 갖고있는 데이터를 섞어 썼을 때 많은 효과가 나타난다. 어떤 한 기업이 규모가 크다고 해서 특정 데이터가 많기 때문에 반드시 우위에 있다고 생각할 필요는 없다"고 잘라 말했다. 

◆ 데이터 댐, 'AI 학습용 데이터' 구축이 핵심...AI 연구·개발 판도 바뀔 전망

정부의 '데이터 댐' 프로젝트 역시 'AI 학습용 데이터' 구축에 핵심을 관통하고 있다. 

강도현 과학기술정보통신부 인공지능기반정책관은 2일 데이터 댐 브리핑에서 "데이터 댐의 가장 기초이고 핵심으로 AI서비스 개발에 필수적인 AI학습용 데이터를 대규모로 구축 ·개방하는 사업"이라며 "대량의 데이터 수집에서부터 가공, 정제, 품질검증까지 많은 일자리가 창출되는 사업"이라고 설명했다.

이번 프로젝트로 인공지능 연구·개발 판도가 송두리째 바뀔 전망이다.

그간 국내 연구기관 및 중견·중소·벤처 기업들은 AI 연구에 활용할 만한 마땅한 공개데이터가 없어 연구·개발에 어려움을 겪어왔다. 사실상 국내 인공지능 연구개발은 네이버, 카카오, SKT 등 데이터 확보가 용이한 소수기업이 독점하는 형태로 지속돼 왔다.

앞으로 150여개의 학습용 데이터가 구축된다면 학교·연구기관·중소벤처기업 등에서 활발한 인공지능 연구개발을 할 수 있는 생태계가 구축될 전망이다. 결국 국내 중소벤처도 구글·넷플릭스·네이버쇼핑 수준의 추천이 가능하고, 자율주행·O2O서비스에서도 중소기업들의 기술 경쟁력을 커질 수 있단 얘기다. 

swiss2pac@newspim.com

[뉴스핌 베스트 기사]

사진
중앙지법, 尹 구속적부심 18일 오전 [서울=뉴스핌] 김현구 기자 = 윤석열 전 대통령에 대한 '내란 특검(특별검사)'의 재구속 적법성 여부가 오는 18일 나온다. 16일 법조계에 따르면 서울중앙지법은 형사9-2부(재판장 류창성)오는 18일 오전 10시15분 윤 전 대통령 측이 청구한 구속적부심을 진행한다. 윤석열 전 대통령. [사진=뉴스핌DB] 윤 전 대통령 측 법률대리인단은 이날 오전 중앙지법에 구속적부심사를 청구했다. 윤 대통령 측은 "적부심의 일반적 법리인 구속이 실체적, 절차적으로 위법·부당하다는 점을 다툴 예정"이라고 밝혔다. 특검은 지난 6일 윤 전 대통령에 대한 구속영장을 청구했다. 이후 서울중앙지법 남세진 영장전담 부장판사는 지난 9일 구속 전 피의자 심문(영장실질심사)을 진행한 뒤 다음 날 새벽 '증거인멸 우려'를 이유로 윤 전 대통령에 대한 구속영장을 발부했다. 형사소송법에 따르면 법원은 구속적부심사 청구가 접수된 후 48시간 이내에 피의자를 심문하고, 증거 조사를 진행해야 한다. hyun9@newspim.com 2025-07-16 14:41
사진
'강선우 임명' 딜레마 빠진 대통령실 [서울=뉴스핌] 박성준 기자 = 이재명 대통령이 강선우 여성가족부 장관 후보자의 임명 여부를 놓고 고심을 거듭하고 있다. '보좌진 갑질' 의혹과 해명 번복, 임금 체불 논란 등이 이어지며 여론이 악화한 가운데, 대통령실은 인사 원칙과 여성 내각 구성이라는 정치적 목표 사이에서 셈법이 복잡해진 분위기다. 강 후보자에 대한 청문회는 지난 15일 마무리됐지만, 논란은 오히려 커졌다. 국회 보좌진들 사이에선 익명 폭로가 이어지고, 여성단체들까지 "사퇴해야 한다"는 성명을 잇달아 내고 있다. 여권 내부에서도 부담을 토로하는 기류가 감지된다. 그럼에도 대통령실은 결정을 미루고 있다. 남은 청문회 과정을 모두 지켜본 후 종합 판단하겠다는 게 현재까지 대통령실 입장이다. 내부적으로 '임명 강행'과 '철회' 사이에서 득실 계산이 한창이다. [서울=뉴스핌] 이재명 대통령이 지난 13일 서울 강남구 코엑스에서 열린 2025 세계정치학회(IPSA) 서울총회 개막식에서 기조연설을 하고 있다. [사진=대통령실] 2025.07.14 photo@newspim.com ◆ 여성 인재 중용 기조...정치적 부담 상존 임명을 강행할 경우, 이재명 정부가 추진하는 여성 인재 중용 기조를 유지할 수 있다는 점이 긍정적으로 작용한다. 이 대통령은 내각 여성 비율을 30% 목표로 한다고 공언했으며, 여성가족부를 존치한 배경에도 그 같은 상징성이 깔려 있다. 실제로 강 후보자 외에도 이진숙 교육부 장관 후보자 등 여성 후보자들이 줄줄이 청문회에 오르면서, 한 명의 낙마가 전체 균형을 흔드는 도미노 효과로 이어질 수 있다는 우려도 있다. 정치적 부담도 고려 대상이다. 강 후보자는 현직 국회의원이다. 만약 청문회를 거쳐 낙마할 경우, 이는 청문회 제도가 도입된 2000년 이후 사실상 처음 있는 '현역 의원 낙마' 사례가 된다. 이는 청문회 제도와 야당의 검증력을 키워주는 반면, 여당에겐 타격이 될 수 있다. 임명을 강행할 경우의 리스크도 작지 않다. 무엇보다 시민사회와 보좌진들 사이에 형성된 비판 여론이 가라앉지 않고 있다는 점에서 정부의 도덕성과 인사 기준 자체에 흠이 날 수 있다. 강 후보자는 앞서 '사적 지시는 없었다'는 취지로 부인했으나, 이후 공개된 텔레그램 메시지로 거짓 해명 논란이 일었다. [서울=뉴스핌] 정일구 기자 = 강선우 여성가족부 장관 후보자가 14일 오전 서울 여의도 국회 여성가족위원회에서 열린 인사청문회에서 의원 질의에 답하고 있다. 2025.07.14 mironj19@newspim.com ◆ '버티기 인사' 반복시 내각 전체 불신 확산 우려 또한 임명 강행은 향후 이진숙 후보자 청문회에도 불똥을 튀게 할 수 있다. 여론이 악화된 상황에서 '버티기 인사'를 반복하면, 결국 전체 내각에 대한 불신으로 확산될 수 있다는 게 일부의 우려다. 대통령실은 16일 이후 여론 흐름 등을 토대로 강 후보자에 대한 거취를 결정할 방침이다. 일각에선 이진숙 후보자 청문회까지 모두 지켜본 뒤, 장관 인선을 '패키지'로 정리할 가능성도 점쳐진다. 정권 초반 인사를 둘러싼 시험대에서 이 대통령이 어떤 선택을 할지 주목된다. 강 후보자의 임명은 단순한 인사 문제를 넘어, 여성 인재 정책과 인사 기준, 여당 내 권력구도와도 맞물린 상징적 분기점이 되고 있다. 한편 더불어민주당 소속 국회의원 보좌진 모임인 민주당보좌진협의회(민보협) 역대 회장단은 이날 성명을 통해 강 후보자의 자진 사퇴를 요구했다. 이들은 "국회의원에게 보좌진은 단순한 직원이 아니라 의정활동 전반을 보좌하는 파트너이자 국민과 국회를 잇는 다리"라며 "그런 보좌진의 인격을 무시한 강 후보자의 갑질 행위는 여성가족부 장관은 물론 국회의원으로서의 기본적 자세조차 결여된 것이라 평가하지 않을 수 없다"고 강조했다. parksj@newspim.com 2025-07-16 14:36
안다쇼핑
Top으로 이동