문헌 4500만 건 및 3억5000만 장 데이터 확보
전문 데이터 검색 및 화학·바이오 데이터 추출 가능
제품 이미지 분석 통한 마케팅 문구 생성
[서울=뉴스핌] 이지용 기자 = LG AI 연구원이 초거대 인공지능(AI) '엑사원 2.0'을 공개했다.
LG AI 연구원은 19일 서울 마곡 LG사이언스파크에서 'LG AI 토크 콘서트'를 열고 초거대 AI 프로그램인 엑사원 2.0의 성능과 시연 과정을 보였다.
LG AI 연구원은 각 관계 기관과의 파트너십을 통해 확보한 특허와 논문 등 약 4500만 건의 전문 문헌과 3억 5000만 장의 이미지를 학습해 이번 엑사원 2.0을 개발했다.
LG AI 연구원은 현존하는 전문 지식 데이터의 상당수가 영어로 되어 있는 점을 감안해 엑사원 2.0을 한국어와 영어를 동시에 이해하고 답변할 수 있도록 '이중 언어' 모델로 개발했다. 이를 통해 학습 데이터 양을 기존 모델 대비 4배 이상 늘려 성능을 높였다.
LG AI 연구원은 엑사원 2.0의 언어 모델을 기존 모델과 동일한 성능을 유지하면서 추론 처리 시간을 25%, 메모리 사용량을 70% 줄여 비용도 78% 절감했다.
배경훈 LG AI 연구원장이 19일 오전 서울 강서구 마곡 LG사이언스파크에서 열린 'LG AI 토크 콘서트 2023'에서 초거대 멀티모달 AI인 EXAONE(엑사원) 2.0을 소개하고 있다. [사진=최지환 인턴기자] |
특히 LG AI 연구원은 이번 엑사원 2.0을 3가지의 플랫폼 '유니버스', '디스커버리', '아틀리에' 등으로 나눠 전문 영역 개발에 나섰다.
엑사원 유니버스는 질의응답·대화, 텍스트 분류·요약, 키워드 추출·생성, 번역 등 기능별로 메뉴를 나눴던 방식에서 전문가용 대화형 AI 플랫폼으로 탈바꿈했다. 각 분야의 전문가들이 정보를 탐색해 즉시 인사이트를 찾을 수 있도록 만든 것이다. 전문가들은 각 도메인별 최신 전문 데이터를 포함해 자료의 근거까지 찾아내 추론한 답변을 얻을 수 있다.
엑사원 디스커버리는 신소재와 신물질, 신약 관련 탐색에 특화된 화학 및 바이오 분야 전문 AI다. 전문 문헌의 텍스트뿐만 아니라 분자 구조, 수식, 차트, 테이블, 이미지 등 비텍스트 정보까지 AI가 읽고 학습해 데이터베이스화하는 '심층 문서 이해' 기술을 적용했다. LG AI 연구원은 엑사원 디스커버리를 통해 1만회가 넘었던 합성 시행착오 실험을 수십회로 줄이고 연구개발 소요 시간을 40개월에서 5개월로 단축시킬 수 있을 것으로 예상하고 있다.
이와 함께 엑사원 아틀리에는 사용자에게 창의적 영감과 아이디어를 제공하는 AI 플랫폼이다. 저작권이 확보된 이미지-텍스트가 짝을 이룬 '페어 데이터 3억5000만장을 학습한 엑사원 2.0을 기반으로 이미지 생성과 이해에 특화된 기능을 제공한다. LG AI 연구원은 제품 이미지를 보고 마케팅 문구를 즉시 생성하고 이를 자연어로 설명할 수 있도록 해 실제 광고 업계에서 활용할 것으로 기대 중이다.
LG AI 연구원은 이번에 공개한 엑사원 유니버스를 이달 31일부터 LG그룹 내 AI 연구자, 협력 중인 대학을 대상으로 서비스를 진행할 예정이다. 또 9월에는 LG에서 AI를 연구하는 임직원을 대상으로 정식 서비스를 추진한다.
LG AI 연구원은 엑사원 디스커버리를 올해 4분기에 LG그룹 내 화학 및 바이오 분야 연구진을 대상으로 서비스를 제공한다. 엑사원 아틀레이는 올해 3분기 그룹 내외부의 전문 디자이너를 대상으로 서비스를 시작한다.
배경훈 LG AI 연구원장은 이날 행사에서 "LG는 국내에서 유일하게 이중 언어 모델과 양방향 멀티모달 모델을 모두 상용화한 기업이며, 세상의 지식을 이해하고 발견하는 상위 1%의 전문가 AI를 개발하고 있다"고 말했다. 이어 "국내외 파트너사와의 협력을 통해 실질적인 성공 사례를 만들어가며 '다른 생성형 AI들과는 차별화된 고객 가치'를 창출하는 글로벌 경쟁력을 갖춘 AI 컴퍼니로 발전해 나갈 것"이라고 강조했다.
leeiy5222@newspim.com