한국어에 특화된 115억 파라미터 모델 무료 공개
데이터 주권, 한국적 가치 담아 '한국식 AI' 구현
MS와 협업 지속…국산 NPU 활용 생태계도 확장
[서울=뉴스핌] 양태훈 기자 = KT가 3일, 'KT AI 기술' 온라인 브리핑을 통해 자사의 AI 전략과 '한국적 AI' 철학을 구체화했다. 데이터 주권 보호와 한국어에 특화된 성능, 국산 AI 반도체와의 연계성 등 다양한 성과를 공개하며, 국내 AI 생태계 주도권 확보를 위한 의지를 분명히 했다.
이날 브리핑에서 KT는 '믿:음 2.0' 모델의 기술적 특징과 철학적 배경, 향후 활용 계획 등을 소개했다. 자체 기술로 개발된 이 모델은 한국어와 한국 문화에 최적화된 언어 모델로, AI 개발자 플랫폼 허깅페이스(HuggingFace)를 통해 누구나 상업적으로 자유롭게 사용할 수 있는 MIT 라이선스로 제공된다.
'믿:음 2.0'은 총 115억 파라미터 규모의 'Base' 모델과 23억 파라미터 규모의 경량화 모델 'Mini'로 구성됐다. 두 모델 모두 한국어와 영어를 지원하며, 문서 기반 질의응답이나 요약 등 실제 활용도가 높은 기능에서 우수한 성능을 발휘한다. 특히 Base 모델은 한국 특화 지식과 B2B 업무 환경에 최적화되어 있으며, Mini 모델은 Base에서 증류한 지식을 바탕으로 경량 환경에서도 성능을 발휘할 수 있도록 설계됐다.
![]() |
사진은 지난 2023년 10월 열린 KT 초거대 AI '믿:음' 출시 기자간담회 모습. [사진=KT] |
신동훈 KT Gen AI Lab장(CAIO)은 이날 브리핑에서 "믿:음 2.0은 한국어와 한국 문화에 최적화된 모델로, 자체 기술로 처음부터 끝까지 개발했다"며 "이번 오픈소스 공개는 대한민국 AI 생태계 전체에 기여하는 계기가 될 것"이라고 강조했다.
이어 "KT는 단순한 모델 공개에 그치지 않고, API, 파인튜닝 가이드, 기술 문서 등 다양한 활용 자원도 함께 제공할 예정"이라며 "개발자들이 믿:음 2.0을 쉽고 유연하게 활용할 수 있도록 실질적인 지원 환경을 구축해 나가겠다"고 덧붙였다.
KT는 '한국적 AI'라는 자체 AI 철학을 바탕으로 믿:음 모델을 개발해 왔다. 실제로 KT는 한국 사회와 문화에 특화된 고품질 데이터를 구축하기 위해 교육용 도서, 법률 및 특허 문서, 사전, 문학 작품 등 다양한 공공, 민간 자료를 수집하고 정제했다. 저작권 이슈가 있는 데이터는 사전에 제거하고, 필요한 경우에는 합성 기법을 통해 데이터셋을 보완하는 등 Responsible AI 기준에 따른 엄격한 데이터 가공 프로세스를 도입했다.
![]() |
[자료=KT] |
믿:음 2.0은 성능 면에서도 기존 모델을 능가한다는 평가를 받고 있다. KT는 고려대학교 민족문화연구원과 공동 개발한 한국어 AI 성능 평가 지표 'Ko-Sovereign' 벤치마크에서 믿:음 2.0이 국내외 주요 오픈소스 모델보다 우수한 점수를 기록했다고 밝혔다. 이 외에도 한국 관련 지식 이해도를 측정하는 'KMMLU', 한국어 언어 모델 평가 지표인 'HAERAE'에서도 경쟁력을 입증했다.
신동훈 랩장은 "믿:음 2.0은 일반적인 생성 능력뿐만 아니라, 한국인의 사고방식과 정서적 뉘앙스를 반영하는 데 초점을 맞췄다"며 "예의범절이나 역사 인식, 감정 표현 등에서 한국적 감수성을 반영할 수 있도록 설계됐다"고 설명했다.
KT는 AI 생태계 전반을 고려해 국산 하드웨어와의 연계성도 확보하고 있다.
![]() |
[자료=KT] |
오승필 KT 기술혁신부문장(CTO·부사장)은 "국내 AI 반도체 기업 리벨리온과 협력해, 믿:음 2.0이 국산 NPU 칩 위에서도 안정적으로 구동될 수 있도록 최적화에 성공했다"며 "국산 AI 하드웨어 생태계와의 시너지를 강화하겠다"고 강조했다.
KT는 자체 개발 모델뿐 아니라 글로벌 협력도 병행 중이다. 마이크로소프트(MS)와 협력해 GPT-4 기반의 한국형 모델도 공동 개발하고 있으며, 향후 고성능 모델을 요구하는 고객을 위한 별도 모델도 순차적으로 공개할 예정이다.
신동훈 랩장은 "고객 환경과 요구에 따라 다양한 모델을 선택할 수 있어야 한다는 것이 KT의 철학"이라며 "자체 개발 모델과 글로벌 협업 모델은 서로 보완적인 관계로 AI 활용성을 넓힐 것"이라고 말했다.
![]() |
[자료=KT] |
한편, KT는 믿:음 2.0의 공개를 계기로 국내 AI 생태계 확산과 산업 전반의 디지털 전환을 지원할 계획이다. 기업과 공공기관은 물론 교육, 금융, 법률 등 다양한 분야에서 믿:음 모델을 활용할 수 있도록 지원하고, B2C 서비스 확대 가능성도 검토 중이다.
아울러 KT는 향후 믿:음 2.0 프로 모델과 멀티모달 AI 모델을 포함한 다양한 라인업을 순차적으로 공개하고, 데이터 얼라이언스 확장과 함께 국가 AI 경쟁력 제고를 위한 전략적 역할을 이어갈 계획이다.
신동훈 랩장은 "이번 공개는 단순히 한 개 모델을 내놓는 데 그치지 않는다"며 "AI의 활용성과 책임성, 한국적 감수성을 모두 갖춘 새로운 대안을 제시하는 것"이라고 강조했다.
dconnect@newspim.com