전체기사 최신뉴스 GAM
KYD 디데이
경제 과학기술

속보

더보기

LLM 모델로 승부 내기 힘든 한국 AI 기업들…개발 생태계에서 후순위 현실화

기사입력 : 2024년05월22일 15:02

최종수정 : 2024년05월22일 15:02

한국어 특화 속도 내지만 금새 추월한 해외 LLM
글로벌 기업 속도 쫓기보단 현실적 경쟁력 절실

[세종=뉴스핌] 이경태 기자 = 초거대인공지능(AI) 시대를 맞았지만 사실상 글로벌 경쟁에서 국내 거대언어모델(LLM)의 경쟁력을 찾는 데 한계가 있다는 지적이 제기된다. 

지난달 과학기술정보통신부는 국내에서 독자 기술로 개발된 LLM 모델로 ▲하이퍼클로바X(네이버, 2023년 8월) ▲엑사원 2.0(LG AI 연구원, 2023년 7월) ▲가우스(삼성전자, 2023년 11월) ▲코난LLM(코난테크놀로지, 2023년 8월), 바르코(엔씨소프트, 2023년 7월) 등 다수의 독자 파운데이션 모델을 보유하고 있는 상황이라고 공식적으로 밝힌 바 있다.

그동안 국내 LLM 개발 기업은 한국어 특화 서비스에 초점을 맞췄다. 사실상 오픈AI가 출시한 챗GPT, 구글의 제미나이, 앤트로픽의 클로드, 메타의 라마 등은 대규모 영어 학습을 통해 독보적인 영어 구사 능력을 보여주고 있다는 판단에서다.

네이버의 경우, 자체 포털 서비스에서 비롯된 다양한 서비스를 활용한 한국어 학습이 최적화됐다는 얘기다. LLM 모델을 독자적으로 개발한 국내 기업들 대부분이 동일한 생각을 갖고 있다.

지난해만 하더라도 정부에서 이에 동의했다. 정부 한 고위급 관계자는 "국내 기업이 아무래도 한글 학습에서는 앞서 있는 게 사실"이라며 "정부도 이같은 방향에서 국내 기업이 제대로 된 서비스를 할 수 있도록 도울 것"이라고 말했다.

하이퍼클로바X와 다른 주요 오픈소스 LLM들의 성능 비교 [자료=국제 논문 사전 공개 사이트 아카이브(arxiv.org)] 2024.05.22 biggerthanseoul@newspim.com

지난달 네이버클라우드는 '하이퍼클로바X'의 세부적인 기술 정보를 담은 테크니컬 리포트를 공개했다. 이 리포트에서는 주로 한국어 모델인 '폴리글롯(1.3B, 5.8B, 12.8B)', 오픈 소스인 '팰컨(7B, 40B)', 메타의 '라마2(7B, 13B, 70B)', 업스테이지의 '솔라 10.7B' 등이 대부분 대부분 매개변수가 적은 소형언어모델(sLM)과의 분석에 초점이 맞춰졌다.

하이퍼클로바X는 한국어, 영어, 수학, 코딩, 상식, 사실성, 안전성 분야에서 우월한 성적을 보이긴 했다. 그러나 곧바로 상황은 급반전됐다.

AI 업계에서는 실제 서비스에 활용하는 LLM 모델로는 GPT 시리즈를 꼽고 있다. 지난주 오픈AI는 GPT-4o(OMNI:모든 것)를 공개했다. 챗과 개발 서비스에서 일부 기능을 이용할 수 있다. 

AI 기업 한 대표는 "생성물의 질적인 측면과 GPT-4o의 상대적인 가성비를 보더라도 국내 기업의 LLM 모델을 활용하는 데는 한계가 많다"며 "오히려 GPT-4부터 한글 능력에서 국내 LLM을 뛰어넘는다는 평가도 있다"고 전했다.

오픈AI가 지난주 공개한 GPT-4o 시연 모습 [사진=오픈AI] 2024.05.22 biggerthanseoul@newspim.com

전원이 오픈AI 출신인 앤트로픽의 클로드는 감성적인 한국어 능력이 특출하다는 평가를 업계에서 받고 있다. 

여기에 지난달 오픈소스로 공개된 메타의 라마3(Llama3)는 한국어에 특화된 것으로 평가된다. 업계에서는 라마3가 GPT-3.5와 GPT-4의 중간 수준에 도달해있다고 말한다. 

국내 기업 중 최근 라마3를 기반으로 LLM 모델을 출시한 테디썸의 경우에는 추가적인 한국어 말뭉치 등을 학습토록 해서 기존 국내 LLM 모델과의 차별성을 높이고 있다.

업계에서는 국내 서비스를 당장 활용할 것에 대해서는 여전히 주춤하는 모습이다. 

AI 기업 한 대표는 "한국어 능력까지 글로벌 기업의 LLM에 뒤처진다는 지적을 받고 있다보니 국내에서도 실제 서비스에는 국내 기업의 서비스를 도입하기에는 추가적인 파인튜닝을 하는데 에너지를 소모할 것 같다"며 "국내 시장에서도 제대로 경쟁이 되지 않는다면 해외로 가기에는 더더욱 어려운 만큼 뭔가 돌파구가 필요하긴 할 것"이라고 말했다.

그는 이어 "국내에서는 대표적인 LLM 모델이라는 하이퍼클로바X가 매개변수가 적은 오픈소스 sLLM 모델을 두고 경쟁 우위를 자체적으로 판단해서 어느 정도 우위에 있다는 리포트를 내는 것에 업계는 높게 평가를 하지는 않는다"며 "오픈AI, 구글, 앤트로픽 등 기업의 LLM 업데이트 속도를 마냥 쫓아가기보다는 좀더 현실적인 경쟁력을 확보할 만한 부분을 찾아야 할 것"이라고 전했다.

biggerthanseoul@newspim.com

[뉴스핌 베스트 기사]

사진
SKT 이용자 1천명, 공동손배소 예고 [서울=뉴스핌] 최수아 인턴기자 = SK텔레콤(SKT) 유심 정보 해킹 사태와 관련해 이용자 1천여 명이 SKT를 상대로 집단 손해배상 청구 공동소송을 예고했다. 법무법인 대륜은 22일 오전 서울 영등포구 소재 사무실에서 기자회견을 열고 "이번 주 또는 늦어도 다음 주 초에는 약 1000명 규모의 손해배상 소송을 제기할 예정이다"라고 밝혔다. 1인당 손해배상 청구 금액은 100만원으로 전해졌다. [서울=뉴스핌] 양윤모 기자 = 손계준 법무법인 대륜 변호사가 21일 오후 SK텔레콤의 유심(USIM) 정보 유출 사태 고발인 조사를 위해 서울 중구 남대문경찰서에 출석하며 입장을 밝히고 있다. 법무법인 대륜은 유영상 SK텔레콤 대표이사와 보안 담당자 등을 정보통신망법 위반, 위계에 의한 공무집행방해, 배임 등의 혐의로 경찰에 고발했다. 2024.05.21 yym58@newspim.com 대륜은 "집단소송 신청자는 1만 명 이상이나 서류 취합까지 완료된 분들에 한해서만 1차 민사소장 접수 예정"이라고 전했다. 이들은 해당 소장을 접수한 이후에도 2차 소장 모집을 계속할 계획이다.  대륜은 "역대 최대 규모의 유심정보 유출 사고로, 장기간 해킹에 노출된 정황이 있으며 피해자들은 유심 교체 등으로 현실적인 불편을 겪었다"면서 "SKT는 보안에 소홀한 반면 높은 영업이익을 유지해왔고, 지금까지도 피해 규모나 경위에 대해 충분히 밝히지 않고 있다"고 지적했다. 이어 "이러한 점을 종합하여 1인당 100만 원의 위자료 청구가 정당하다고 판단했다"고 설명했다. 또 "SKT는 고객의 개인정보를 안전하게 보호해야 할 의무가 있음에도 불구하고, 정보보호에 있어 구조적인 소홀과 의도적인 비용 감축 정황이 확인된다"고 주장했다. 공동소송이란 원고 또는 피고 혹은 그 쌍방이 여러 사람일 경우, 즉 소송주체가 다수일 경우를 의미한다. 이번 사건처럼 다수에게 피해가 발생했을 때 다수의 피해자가 함께 소송에 참여한다.  앞서 대륜은 지난 1일 SKT 유영상 대표이사와 SKT 보안 책임자를 업무상 배임과 위계 공무집행 방해 등의 혐의로 경찰에 고발했으며 전날(21일) 남대문경찰서에서 고발인 조사를 받았다. geulmal@newspim.com 2025-05-22 12:49
사진
폭스콘 "AI 데이터센터, 단계 건설" [서울=뉴스핌] 고인원 기자= 세계 최대 전자 위탁생산업체인 대만 폭스콘이 미국 반도체 기업 엔비디아와 함께 추진 중인 인공지능(AI) 데이터센터 프로젝트가 최대 100메가와트(MW) 규모로 단계적으로 건설될 예정이라고 밝혔다. 류양웨이 폭스콘 회장은 대만 타이베이에서 열린 '2025 컴퓨텍스 타이베이' 기조연설에서 "이번 AI 데이터센터는 엄청난 전력이 필요한 만큼, 단계적으로 구축할 것"이라며 "1차로 20메가와트 규모로 시작한 뒤, 40메가와트를 추가로 설치할 예정이며, 궁극적으로는 100메가와트까지 확대할 계획"이라고 말했다. 이 프로젝트는 전날 엔비디아가 대만을 대표하는 제조 기업 TSMC·폭스콘 및 대만 정부와 함께 초대형 AI 생태계를 대만에 구축한다고 발표한 데 따른 후속 설명이다. 2024년 10월 8일 대만 타이페이에서 열린 폭스콘 연례 기술 전시회에 전시된 폭스콘 전기이륜차 파워트레인 시스템 [서울=뉴스핌]박공식 기자 = 2025.05.14 kongsikpark@newspim.com 류 회장은 "전력은 대만에서 매우 중요한 자원"이라며 "공급 부족이라는 표현은 쓰고 싶지 않지만, 이를 감안해 여러 도시를 대상으로 부지를 분산하는 방식으로 데이터센터를 건설할 것"이라고 설명했다. 일부 시설은 대만 남서부 가오슝시에 우선 들어서며, 나머지는 전력 여건에 따라 다른 도시로 확대될 수 있다고 덧붙였다. 이날 류 회장의 키노트 무대 위로 젠슨 황 엔비디아 CEO가 깜짝 등장해 눈길을 끌었다. 황 CEO는 "이번 AI 센터는 폭스콘, 엔비디아, 그리고 대만 전체 생태계를 위한 시설"이라며 "우리는 대만을 위한 AI 팩토리를 만들고 있다. 여기에는 대만의 350개 파트너사가 참여하고 있다"고 강조했다. 이번 AI 데이터센터는 고성능 컴퓨팅 인프라 확보를 통해 AI 학습 및 추론 속도를 크게 높이고, 대만 내 AI 산업 생태계 전반에 걸쳐 활용될 것으로 기대된다. koinwon@newspim.com 2025-05-20 23:40
안다쇼핑
Top으로 이동