기술 노하우 살려 데이터 수집 및 학습 데이터 연구
[서울=뉴스핌] 정윤영 기자 = NHN이 한국어 음성인식 서비스 활성화를 위한 자유대화 분야 'AI 학습용 데이터 구축 사업' 수행기관으로 선정됐다고 6일 밝혔다.
이번 프로젝트는 과학기술정보통신부 주관, 한국정보화진흥원(NIA)이 추진하는 '제2차 인공지능 학습용 데이터 구축 사업'의 일환으로 진행된다.
NHN CI. [제공=NHN] |
국내 노인, 소아 계층의 음성 대화 DB, 학습 데이터 등이 부족하다는 점에 착안, 양질의 데이터를 확보해 이를 필요로 하는 곳에 활용되도록 기여한다는 계획이다.
NHN은 인공지능 및 자연어 처리 기술에 대한 오랜 노하우를 바탕으로 관련 데이터 ▲수집, ▲가공, ▲검수, ▲학습, ▲유효성 검사 관리를 위한 시스템 개발 등 전 과정을 지원한다.
데이터 수집 과정에 인공지능 스피커, 음성 기반 채팅 서비스 등 효율적인 방식을 도입하고, EBS 교육채널, NHN 에듀 교육서비스 채널 등을 활용해 다양한 테스터 및 DB를 확충해 나갈 예정이다.
박근한 NHN 기술연구센터 센터장은 "자유대화 분야의 AI연구를 통해 한국어 음성인식 품질을 한층 높이고, 음성인식뿐 아니라 자연어 처리 분야 발전에도 기여해 나갈 것"이라며 "이번 연구로 구축된 정보가 다양한 곳에 적극 활용되길 바란다"고 말했다.
yoonge93@newspim.com