전체기사 최신뉴스 GAM
KYD 디데이
산업 ICT

속보

더보기

카카오, 자체 개발 AI 모델 '카나나' 연구 성과 공개

기사입력 : 2025년02월27일 11:01

최종수정 : 2025년02월27일 11:01

글로벌 수준 한국어·영어 성능 구현
경량 모델 'Kanana Nano 2.1B' 오픈소스로 배포

[서울=뉴스핌] 양태훈 기자 = 카카오가 자체 개발한 AI 언어모델 'Kanana'의 연구 성과를 담은 테크니컬 리포트를 공개하고 국내 AI 생태계 활성화를 위해 경량 모델을 오픈소스로 배포했다.

27일 카카오는 자체 개발 언어모델 'Kanana'의 연구 성과를 담은 테크니컬 리포트를 아카이브(ArXiv)에 공개했다고 밝혔다. 또한 언어모델 라인업 중 'Kanana Nano 2.1B' 모델을 깃허브(GitHub)에 오픈소스로 배포했다.

테크니컬 리포트에는 카나나 언어모델 전체의 매개변수와 학습 방법, 학습 데이터 등 세부 사항과 함께 Pre-training부터 Post-training까지 전 과정이 자세히 담겼다. 카나나 모델의 구조, 학습 전략 및 글로벌 벤치마크 성과도 확인할 수 있다.

[사진=카카오]

카카오의 초거대 언어모델 'Kanana Flag'는 지난해 말 학습을 완료했다. 이로써 카카오는 작년 10월 개발자 컨퍼런스 'if(kakaoAI)2024'에서 공개한 'Kanana Flag', 'Essence', 'Nano' 등 '카나나 언어모델' 전체 라인업을 모두 구축하게 됐다.

'Kanana Flag'는 한국어 성능을 평가하는 'LogicKor', 'KMMLU' 벤치마크에서 타 모델을 압도하는 처리 능력을 입증했으며, 영어 성능을 평가하는 'MT-bench', 'MMLU' 벤치마크에서는 경쟁 모델과 유사한 성과를 기록했다. 또한 학습 자원 최적화를 통해 유사 사이즈의 모델 대비 50% 이상 비용을 절감하며 최고 수준(SOTA)의 효율성과 성능을 동시에 구현했다.

카카오는 대규모 언어모델의 학습 효율을 극대화하기 위해 ▲Staged pre-training ▲Pruning(모델 구성 요소를 가지치기해 중요 요소만 남기는 기법) ▲Distillation(큰 모델의 지식을 더 작은 모델로 전달하는 증류 기법) ▲DUS(Depth Upscaling, 깊이 업스케일링) 등 혁신적 학습 기법을 적용했다. 이를 통해 경량 모델부터 초거대 모델까지 다양한 사이즈의 고성능 모델을 효율적으로 개발, 글로벌 유사 크기 모델 대비 절반 이하의 학습 비용을 실현했다.

오픈소스로 공개된 'Kanana Nano 2.1B'는 연구자와 개발자가 활용하기 적절한 크기의 모델이며, 온디바이스(On-device) 환경에서도 활용 가능한 고성능 경량 모델이다. 비교적 작은 규모임에도 유사한 크기의 글로벌 모델에 견줄 만한 성능을 보여주며, 한국어와 영어 처리 능력에서 뛰어난 결과를 나타낸다. 베이스 모델과 인스트럭트(Instruct) 모델, 임베딩(Embedding) 모델이 깃허브를 통해 제공된다.

카카오는 향후 카나나 모델에 강화 학습(Reinforcement Learning)과 연속 학습(Continual Learning) 기반의 최신 기술을 접목해 추론, 수학, 코딩 능력을 강화하고, 정렬(Alignment) 기술을 고도화해 사용자 요청의 수행 정확도를 높일 계획이다.

김병학 카카오 카나나 성과리더는 "모델 최적화와 경량화 기술을 바탕으로 라마, 젬마 등 글로벌 AI 모델과 견줄 수 있는 고성능의 자체 언어모델 라인업을 효율적으로 확보하게 됐으며, 이번 오픈소스 공개를 통해 국내 AI 생태계 활성화에 기여할 수 있을 것으로 기대한다"고 말했다.

dconnect@newspim.com

[뉴스핌 베스트 기사]

사진
온열질환 사망자 전년 대비 2배 증가 [서울=뉴스핌] 조민교 기자 = 찜통더위가 이어지면서 올여름 온열질환자 수가 작년 대비 급증했다. 온열질환 추정 사망자는 최근 2명이 추가돼 현재까지 7명으로 집계됐다. 7일 질병관리청의 온열질환 응급실감시체계 신고 현황에 따르면 지난 6일 59명이 온열질환으로 응급실에 내원했다. 이중 2명은 온열질환으로 인해 사망했다. 질병청이 지난 5월 15일부터 전국 의료기관 517곳 응급실을 대상으로 온열질환 감시체계를 가동한 이래 전날까지 누적 온열질환자는 모두 875명이다. [서울=뉴스핌] 김학선 기자 = 서울 전역에 올해 첫 폭염주의보가 발효된 30일 오후 서울 성동구 마장역 인근에서 시민들이 무더위에 힘겨워하고 있다. 2025.06.30 yooksa@newspim.com 지난해 같은 기간(5월 20일~7월 6일)과 비교하면 온열질환자는 469명에서 859명으로 83.2% 증가했다. 올해 온열질환 추정 사망자는 모두 7명으로, 작년 같은 기간(3명)과 비교해 2배 이상 늘어났다. 현재까지 발생한 온열질환자의 76.5%는 남성이었으며 여성은 23.5%였다. 연령별로는 60대가 19.5%로 가장 많았으며 이어 50대, 40대, 30대, 80세 이상, 70대, 20대 순이었다. 65세 이상 고령층이 전체 온열질환자의 33.3%를 차지했다. 직업별로는 단순 노무 종사자(21.0%), 무직(12.0%), 농림어업 숙련 종사자(10.4%)가 많았다. 발생 시간을 보면 오후 4~5시(12.2%), 오후 3~4시(11.5%), 오후 1~2시(9.5%), 오전 10~11시 (9.0%) 등으로 나타났다. 실외 발생이 81.4%였으며 작업장 25.6%, 논밭 16.6%, 길가 14.1% 등이었다. 온열질환은 열로 인해 발생하는 급성질환으로 통상 두통, 어지러움, 근육경련, 피로감 등의 증상을 동반한다. 제때 조치하지 않으면 의식 저하가 나타나면서 자칫 생명이 위태로울 수도 있다. 흔히 일사병으로 불리는 열탈진과 열사병이 대표적이다. 평소 온열질환을 예방하려면 한낮에는 가급적 외출과 야외활동을 삼가고, 갈증을 느끼지 않더라도 물을 자주 마시면서 체내 수분을 적절히 공급해 주는 게 좋다. mkyo@newspim.com 2025-07-07 20:26
사진
삼성전자, 2Q 영업익 56% 뒷걸음 [서울=뉴스핌] 서영욱 기자 = 삼성전자가 전년 동기 대비 절반 이상 하락한 2분기 잠정 영업 실적을 내놨다. 삼성전자가 8일 올해 2분기 잠정 실적을 공시하고 매출 74조원, 영업이익은 4조6000억원을 달성했다고 밝혔다. 전 분기 보다 매출은 6.5%, 영업이익은 31% 줄었다. 작년 동기 대비 매출은 비슷했지만, 영업이익은 56% 가까이 내려앉았다. 서울 서초구 삼성전자 서초사옥 전경 [사진=뉴스핌DB] 이번 잠정치는 한국채택 국제회계기준(IFRS)에 따라 추정한 수치다. 결산을 마치기 전 투자자들의 편의를 위해 먼저 공개한 것이다. 삼성전자는 2009년 7월 국내 기업 처음으로 분기 실적 예상치를 내놨다. 2010년 IFRS를 먼저 적용해 글로벌 기준에 맞춘 정보 제공을 이어가며 투자자들이 보다 정확히 실적을 가늠하고 기업 가치를 판단할 수 있도록 하고 있다. 삼성전자는 이번에도 주주와 소통을 꾀한다. 실적발표 콘퍼런스콜에서 사전에 받은 질문을 중심으로 관심 높은 사안에 답할 계획이다. syu@newspim.com 2025-07-08 07:52
안다쇼핑
Top으로 이동