전체기사 최신뉴스 GAM 라씨로
KYD 디데이
경제 과학기술

속보

더보기

서울과기대·테디썸, 라마3-70B 기반 한글 특화 LLM '블라썸' 세계최초 공개

기사입력 : 2024년05월09일 14:21

최종수정 : 2024년05월09일 14:21

라마3 70B 모델에 한국어 확장 첫 사례
업스테이지·솔트룩스·마음AI에 도전장
블라썸, 기본 모델 대비 89% 답변 향상

[세종=뉴스핌] 이경태 기자 = 국내 연구진과 인공지능(AI) 기업이 공동연구를 통해 메타의 오픈소스 거대언어모델(LLM)을 활용한 한국어 어휘 확장 대형 모델을 세계 최초로 개발했다. 

이미 오픈소스 기반 LLM 개발 업체인 업스테이지, 솔트룩스, 마음AI에 한발 앞선 기술력으로 도전장을 내민 셈이다.

서울과학기술대학교 다층퍼셉트론(MLP)연구실과 테디썸은 9일 오후께 한국어 최초 70B급 한국어-영어 초거대 언어모델 블라썸(Bllossom)을 완전 공개했다. 이는 현재 가장 좋은 성능으로 평가받는 공개 언어모델인 라마3(LLama3-70B) 기반 모델 중 어휘 확장 모델로는 전세계에서 최초로 꼽힌다.

메타는 지난달 18일(현지 시간) 자체 개발한 오픈소스 거대언어모델(LLM)인 라마(Llama)의 3세대 버전을 무료로 출시했다. 라마 3는 8B 및 70B 매개변수 두 모델로 우선 공개됐다. 라마3은 15조 개의 토큰으로 학습됐다. 

이 가운데 70B 모델은 오픈AI가 개발한 GPT-3.5보다 성능이 좋고 GPT4 성능에 근접한 수준이라는 평가를 일부 받는다. 라마3는 한국어에 특화돼 있는 모델로 평가된다.

테디썸이 라마3 70B 모델을 활용해 자체 개발한 한국어 특화 확장 거대언어모델인 '블라썸'을 허깅페이스에 9일 게재했다. 실제 전체 공개는 이날 오후께 진행된다. [사진=테디썸] 2024.05.09 biggerthanseoul@newspim.com

서울과기대와 테디썸은 라마3 70B모델에 추가적인 어휘확장을 했다.

어휘 확장은 특정 언어의 단어를 추가해 심층적인 표현이 가능하도록 하는 방법이다. 70B급 거대 언어모델은 어휘를 확장하면 새로운 어휘의 표현학습을 위해 엄청난 추가 학습시간 및 비용이 소요된다. 이렇다보니 70B급 모델에 어휘확장이 시도된 사례는 한국어에서는 아직 찾아볼 수 없다. 

이번 블라썸 모델은 서울과기대 슈퍼컴퓨팅센터의 컴퓨팅 지원을 토대로 대량의 GPU를 활용해 어휘확장 및 영어-한국어 지식 연결 학습이 가능했던 것으로 파악됐다.

임경태 서울과기대 인공지능응용학과 교수 연구팀은 이번 모델 개발을 위해 ▲한국어 표현력 강화를 위한 3만개가 넘는 한국어 어휘 추가 ▲한국어 어휘 표상 학습을 위한 대규모 사전학습 ▲한국어-영어 지식 연결을 위한 Parallel 학습 ▲한국어-영어 지식 표현을 위한 지시미세조정(Instruction Tuning) ▲사용자 피드백(feedback) 기반의 강화학습 등을 진행했다.

방대한 영어 지식을 한국어와 연결시키기 위해 직접 구축한 병렬(Parallel) 데이터 셋을 활용했다는 점과 언어학자들이 직접 구축한 정교한 지시미세조정 데이터가 성능을 크게 향상시켰다는 점이 이번 모델 개발에서 주목할 만한 요소다.

테디썸은 이번에 개발한 모델을 전체 공개해 개별적인 추가 학습과 상업적 이용이 가능하다는 점을 강조했다.

이번 모델은 한국어 토큰 확장으로 인해 25% 확장된 컨텍스트 활용이 가능하다. 인간평가와 GPT4 한국어 답변 선호도 평가 결과 GPT3.5와 유사하거나 약간 앞선 결과를 보인 바 있다. 라마3 70B 기본모델 대비 한국어 답변에 대해 89% 더 높은 답변 선호도 평가를 기록했다.

테디썸은 이미 8B 소형 모델은 전세계 기술 공유 플랫폼인 허깅페이스에 공개됐고 70B 거대모델도 이날 함께 공개했다. 개인 GPU에서 작동 가능한 4bit 양자화된 모델과 직접 활용해볼 수 있는 데모도 함께 내놓는다.

함영균 테디썸 대표는 "기존 빅테크에서만 연구개발하고 공개되지 않던 70B 거대 모델을 중소규모 회사 및 연구 그룹에서도 활용할 수 있도록 초거대 언어모델의 민주화에 기여했다는 점에서 의미있는 첫 발자국이라 생각한다"고 말했다.

한편 국내에서 라마3 소형 모델인 8B를 기반으로 자체 LLM 모델을 개발해 공개한 기업은 솔트룩스, 마음AI 등이다. AI 기업 데이터드리븐의 이준범 수석 AI 연구원도 개인적으로 8B 기반 모델을 공개한 바 있다.

biggerthanseoul@newspim.com

[뉴스핌 베스트 기사]

사진
대법, 이재명 선거법 사건 전합 회부 [서울=뉴스핌] 김현구 기자 = 이재명 전 더불어민주당 대표의 공직선거법 위반 사건을 전원합의체에 회부한 대법원이 22일 곧바로 심리에 들어갔다. 대법원 전원합의체(전합)는 이날 오후 2시부터 이 전 대표의 공직선거법 위반 사건 상고심 첫 합의기일을 진행하고 있다. [서울=뉴스핌] 이호형 기자 = 이재명 더불어민주당 전 대표가 22일 오전 서울 서초구 서울중앙지방법원에서 열리는 '대장동 배임 및 성남FC 뇌물 혐의' 1심 속행 공판에 출석 하고 있다. 2025.04.22 leemario@newspim.com 앞서 대법원은 이날 오전 이 전 대표 사건 2부에 배당하고 주심으로 박영재 대법관을 지정했다. 하지만 이후 조희대 대법원장이 이 전 대표 사건을 전원합의체에 회부했고, 첫 합의기일도 열리게 됐다. 전합은 종전의 판례를 바꾸는 등 사회적 파장이 큰 중요 사건을 다룬다. 대법원장이 직접 재판장을 맡고, 법원행정처장을 겸임하는 대법관을 제외한 나머지 대법관 12명 등 총 13명으로 구성된다. 단 이번 사건에선 중앙선거관리위원장을 맡고 있는 노태악 대법관이 회피신청을 했다. 이에 이 사건은 조 대법원장과 나머지 대법관 11명 등 총 12명이 심리할 전망이다. 이 전 대표의 공직선거법 위반 사건이 전합에 회부되면서, 이 전 대표는 2020년에 이어 두 번째 전합 판단을 받게 됐다. 이 전 대표는 2016년 6월 성남시장으로 있으면서 보건소장, 정신과 전문의 등에게 친형을 정신병원에 강제 입원시키도록 지시하고, 2018년 지방선거를 앞두고 열린 TV토론회 등에서 친형을 강제 입원시키도록 지시한 적이 없다는 허위 발언을 한 혐의로 재판에 넘겨졌다. 그는 1심에서 무죄를 선고받았으나 2심에선 벌금 300만원을 선고받았다. 하지만 2020년 7월 전합은 이 전 대표 사건을 7(파기환송)대 5(상고기각)로 무죄 취지 파기환송했고, 이후 파기환송심에서 무죄가 나온 뒤 그대로 확정됐다. 대법원이 본격적인 심리 절차에 들어가면서 이 전 대표 사건 선고 시점에 대한 관심이 커지고 있다. 공직선거법 사건은 '6·3·3원칙(1심 6개월, 2·3심 3개월)'을 준용하게 돼 있기 때문에 원칙대로라면 오는 6월 26일까지 선고가 나와야 한다. 하지만 같은 달 3일 대통령 선거가 예정돼 있고 이 전 대표가 유력 후보로 꼽히는 만큼, 이전에 결론이 나기는 쉽지 않을 것이란 관측이 나온다. 한편 이 전 대표는 지난 대선 과정에서 대장동 개발사업의 핵심 실무자였던 고(故) 김문기 전 성남도시개발공사 개발1처장 및 백현동 개발사업과 관련해 허위 발언을 한 혐의로 기소됐다. 이 전 대표는 1심은 이 전 대표가 방송 인터뷰에서 "해외 출장 중 김문기와 골프를 치지 않았다"고 한 부분과 국회 국정감사에서 "국토부 요구에 따라 어쩔 수 없이 (백현동 한국식품연구원 부지) 용도변경을 해준 것"이라는 취지로 말한 부분이 허위사실에 해당한다며 징역 1년에 집행유예 2년을 선고했다. 하지만 2심은 해당 발언들이 모두 허위사실에 해당하지 않는다며 1심 판단을 뒤집고 무죄를 선고했다. 이에 검찰은 "법원의 판단은 피고인의 발언에 대한 일반 선거인들의 생각과 너무나도 괴리된 경험칙과 상식에 부합하지 않는 판단으로 공직선거법의 허위사실공표죄에 관한 법리를 오해한 위법이 있다"며 상고를 제기했다. hyun9@newspim.com 2025-04-22 15:23
사진
명동성당 프란치스코 교황 애도 물결 [서울=뉴스핌] 양진영 기자 = 프란치스코 교황이 21일(현지시간) 선종한 가운데, 국내 명동대성당에 공식 조문을 위한 분향소가 마련됐다. 조문을 하러 온 천주교 신자들은 애통한 마음을 감추지 못하며 명복을 빌었다.  22일 명동대성당 지하성당에 프란치스코 교황 빈소가 마련됐으며 이날 오후 3시부터 일반 조문이 진행됐다. 여기에는 한덕수 대통령 권한대행 국무총리, 유인촌 문화체육관광부 장관 등이 조문을 다녀갔다. [서울=뉴스핌] 윤창빈 기자 = 22일 오후 지난 21일(현지시간) 선종한 프란치스코 교황의 빈소가 마련된 서울 중구 명동대성당 지하성당에서 조문객들이 추모를 하고 있다. 2025.04.22 pangbin@newspim.com 이날 공식 분향소에는 염수정 추기경, 정순택 대주교, 구요비 주교, 이경상 주교를 비롯한 주교단 조문 이후 일반인들의 조문이 시작됐다.  한덕수 대통령 권한대행 국무총리는 공식 분향소를 찾아 분향하고 "제266대 故프란치스코 교황은 천주교회와 전 세계 신자들에게 깊은 영적 가르침과 믿음의 유산을 남기셨다"면서 "늘 겸손하고 소탈하신 모습으로 가난한 이들과 사회적 약자에 대한 사랑을 실천하신 故프란치스코 교황께 깊은 감사와 애도를 표한다"고 밝혔다. 천주교 신자인 유인촌 장관도 오후 3시 20분께 조문했다.  [서울=뉴스핌] 사진공동취재단 = 염수정 추기경, 정순택 대주교 등 서울대교구 주교단이 22일 서울 명동대성당 지하성당에 마련된 프란치스코 교황 빈소를 찾아 조문하고 있다. 2025.04.22 photo@newspim.com 적지 않은 비가 내리는 평일 낮 시간임에도 공식 분향소에는 천주교 신자들의 조문이 조용히 이어졌다. 번잡하거나 사람이 북적이지는 않았지만, 차분한 표정으로 분향소를 향하는 조문객들의 발걸음이 분주했다. 검은 복장으로 공식 분향소를 찾은 박 씨(70대, 여)는 "(교황의) 선종 소식을 듣고 마음이 아팠다. 좋은 곳으로 가셔서 이제는 평안하시길 빈다"고 애도했다. 신앙을 함께하는 이들과 동행한 그는 "예수님을 먼저 뵙고 조문하려고 한다"면서 예배당으로 들어갔다. [서울=뉴스핌] 윤창빈 기자 = 22일 오후 지난 21일(현지시간) 선종한 프란치스코 교황의 빈소가 마련된 서울 중구 명동대성당에서 조문객들이 추모를 위해 줄을 서고 있다. 2025.04.22 pangbin@newspim.com [서울=뉴스핌] 양윤모 기자 = 제266대 프란치스코 교황이 선종한 가운데, 22일 서울 중구 명동성당 영성센터 건물 외벽에 교황의 사진이 걸려있다. 2025.04.22 yym58@newspim.com 또 다른 천주교 신자 김 씨(60대, 여)는 "이렇게 빨리 가실 지 몰랐다. 제겐 비보로 다가왔다. 불과 며칠 전에 공식석상에서 말씀하셨던 모습을 기억한다"면서 "그분 말씀을 하니 마음이 또 뭉클하다. 항상 가난한 이들을 돌보셨던 훌륭한 분이다. 부활절 다음날 돌아가신 게 분명 좋은 곳으로 가시리라 믿는다"고 말했다.  서울대교구 측에 따르면 이날부터 언제까지 조문을 받을 지는 결정되지 않았다. 향후 교황청에서 장례 일정을 정하면 그에 따라 조문 절차를 운영할 예정이다.  jyyang@newspim.com 2025-04-22 16:49
안다쇼핑
Top으로 이동