자기 점검 과정 도입해 환각 현상 최소화
동급 글로벌 모델 대비 수학·과학·시각 이해 성능 우위
[서울=뉴스핌] 양태훈 기자 = 카카오가 5일 하나의 모델로 일상 대화와 고난도 추론을 모두 수행할 수 있는 한국형 하이브리드 멀티모달 언어모델 'Kanana-v-4b-hybrid'를 공개했다.
Kanana-v-4b-hybrid는 가벼운 일반 대화부터 논리적 사고와 계산이 필요한 복잡한 문제 해결까지 단일 모델로 처리할 수 있도록 설계됐다.
이 모델은 지난해 7월 오픈소스로 공개된 'Kanana-1.5-v-3b'를 기반으로 개발됐다. 단순한 이미지 설명이나 텍스트 변환을 넘어, 사람처럼 정보를 종합하고 계산한 뒤 스스로 검산하는 자기 점검 과정을 거치는 것이 특징이다. 이를 통해 AI 모델에서 반복적으로 지적돼 온 환각 현상을 줄이고, 표·영수증·수학 문제 등 복합적인 조건이 포함된 과제에서 계산 오류나 조건 누락 가능성을 낮췄다는 설명이다.

카카오는 모델 성능 향상을 위해 ▲기초 학습 ▲장문 사고 사슬(Long Chain of Thought) ▲오프라인 강화학습 ▲온라인 강화학습으로 이어지는 4단계 학습 절차를 적용했다. 이를 통해 추론 정확도와 문제 해결 능력을 동시에 끌어올렸다고 밝혔다.
특히 한국어 논리 전개 능력에서 경쟁력을 입증했다는 점을 강조했다. 기존 글로벌 모델들이 한국어 질문을 영어로 번역해 사고한 뒤 다시 번역하는 과정에서 맥락 손실이 발생하는 반면, 해당 모델은 한국어를 그대로 이해하고 사고하도록 학습됐다. 이 같은 특성을 바탕으로 대학수학능력시험 사회탐구와 수학 영역 문제에서 높은 정답률을 기록했으며, 한국 교육 체계를 기반으로 한 AI 학력 평가 벤치마크 'KoNET(Korea National Educational Test Benchmark)'에서는 92.8점을 획득했다.
또한 유사한 크기의 글로벌 모델들과의 비교 평가에서 과학·공학, 일반 시각 질의응답, 문서 이해 등 다양한 영역에서 높은 성능을 보였고, 수학·과학과 같이 복잡한 추론이 필요한 영역과 시각 이해 능력에서는 일부 글로벌 모델을 상회하는 결과를 기록했다고 회사 측은 설명했다.
카카오는 향후 사용자가 별도로 모델을 선택하지 않아도 AI가 질문의 복잡도를 스스로 판단해 일반 모드와 추론 모드를 자동 전환하는 형태로 모델을 고도화할 계획이다. 이를 통해 단일 대화 환경에서 다양한 난이도의 질문을 자연스럽게 처리하면서도 연산 자원을 효율적으로 활용하는 것을 목표로 하고 있다.
김병학 카카오 카나나 성과리더는 "이번 모델은 한국어 환경에서 자연스럽고 정확한 사고와 응답이 가능하도록 설계된 연구 성과"라며 "자체 AI 기술 고도화를 통해 글로벌 경쟁력을 높이는 동시에 국내 AI 연구 생태계 발전에도 기여하겠다"고 말했다.
한편 카카오는 앞서 멀티모달 언어모델 'Kanana-o'와 'Kanana-v-embedding'을 공개한 데 이어, 에이전틱 AI 구현에 최적화된 언어모델 'Kanana-2'를 오픈소스로 공개하는 등 AI 기술 연구를 지속하고 있다.
dconnect@newspim.com












