'KISTI 이슈브리프 제26호' 발간
[대전=뉴스핌] 김태진 기자 = 한국과학기술정보연구원(KISTI)은 디지털 뉴딜·데이터댐의 핵심인 인공지능(AI) 개념과 국내외 기계학습 데이터 현황을 살펴보고 연구원이 추진하고 있는 과학기술 기계학습 데이터 구축 및 활용방안을 'KISTI 이슈브리프 제26호'에서 소개한다.
26일 KISTI에 따르면 기계학습은 AI의 특정 연구 분야로 '명시적으로 프로그램 되지 않고 학습할 수 있는 능력을 컴퓨터에게 주는 AI 연구 분야'로 정의된다.
기계학습 데이터는 특정목적(문서분류, 문서요약, 영상이해, AI 비서 등)을 위하여 기계가 학습할 수 있도록 용도에 맞게 잘 정제된 데이터를 뜻한다.
KISTI 이슈브리프 제26호 설명 이미지[사진=한국과학기술정보연구원] 2020.10.26 memory4444444@newspim.com |
때문에 AI 성공은 지속적이며 신뢰성 있는 양질의 학습 데이터 확보가 필수적이다.
기계학습에서 데이터는 자동차의 연료와 같은 역할을 하며, 높은 수준의 기계학습을 구현하기 위해선 많은 양의 양질의 데이터가 반드시 필요하다.
국내 기계학습 데이터는 주로 해외에서 공개된 기계학습 데이터를 활용해 AI 기술개발 및 연구를 수행하고 있다.
독자적인 AI 활용을 위해 한국형 이미지, 한국어 텍스트, 한국어 음성, 한국형 영상 데이터가 필요하다.
이에 KISTI는 과학기술분야 기계학습 데이터를 대규모로 구축해 AI 기반의 기술혁신으로 데이터 경제 견인에 이바지하기 위해 과학기술 기계학습 데이터 구축사업을 추진 중이다.
이를 통해 코로나19 사태 발생 이후 일자리 축소 등 열악한 경제 상황에 대응해 대규모 공공인프라 사업 추진을 통한 비대면 일자리를 창출하려 한다.
또 과학기술분야 국내논문, 국가 R&D 연구보고서 대상으로 하는 다수의 작업공정(직접입력, 레이블링, 태깅, 품질검수 등)으로 AI 학습 데이터 구축 활용확산 등을 추진한다.
과학기술 기계학습 데이터 활용 범위 및 기대효과는 크다.
과학기술 분야 지식자원의 AI 연계 및 융합 연구 지원은 물론 국가 R&D 정책 수립 시 의사결정 지원, 산업 기술 혁신을 위한 의사결정 및 비즈니스 활용 등을 지원한다.
최희윤 KISTI 원장은"코로나19의 위기를 계기로 데이터의 중요성이 크게 부각됐다"며, "집단지성을 통해 대규모로 구축된 과학기술분야 기계학습 데이터는 과학기술연구 전주기를 지원하는 AI서비스에 활용해 학제 간 융합연구의 촉매제가 되고, 기술혁신과 새로운 비즈니스 창출에 기여할 것"이라고 말했다.
memory4444444@newspim.com