핵심 두뇌는 자체 개발…외부 인코더는 전략적 선택
"표준화된 인코더 활용, 글로벌 AI 업계의 보편적 설계 방식"
[서울=뉴스핌] 양태훈 기자 = 네이버클라우드가 정부의 '독자 AI 파운데이션 모델 프로젝트'와 관련된 기술 자립성 논란에 대해 '하이퍼클로바X'의 핵심 추론 엔진은 프롬 스크래치 단계부터 100% 자체 기술로 개발됐다고 5일 해명했다.
이번 논란은 네이버클라우드의 하이퍼클로바X 멀티모달 모델이 음성·이미지 입력을 처리하는 비전·오디오 인코더 일부에 외부 오픈소스 모델을 활용한 사실이 알려지면서 불거졌다. 정부가 추진하는 독자 파운데이션 모델 프로젝트 취지에 비춰 볼 때, 모델을 처음 단계부터 모두 자체 구축하는 이른바 '프롬 스크래치' 기준에 부합하는지 여부가 쟁점으로 떠올랐다.
네이버클라우드는 이에 대해 파운데이션 모델의 본질은 입력된 정보를 해석하고 추론해 결과를 만들어내는 핵심 영역에 있으며, 이는 인간으로 치면 사고와 정체성을 담당하는 '두뇌'에 해당한다고 설명했다. 또한, 핵심 엔진은 프롬 스크래치 단계부터 자체 기술로 개발해 왔으며, 이를 통해 한국어와 한국 사회의 복잡한 맥락을 깊이 이해하는 독자적인 경쟁력을 확보했다는 입장이다.

논란이 된 비전·오디오 인코더와 관련해서는 기술적 자립도가 부족해서가 아니라 글로벌 기술 생태계와의 호환성과 전체 시스템의 효율적 최적화를 고려한 전략적 선택이라고 강조했다. 비전 인코더는 시각 정보를 모델이 이해할 수 있는 신호로 변환하는 '시신경' 역할을 하며, 네이버는 VUClip 등 자체 비전 기술 역량도 충분히 보유하고 있다는 설명이다.
네이버클라우드 관계자는 "멀티모달 AI에서 가장 어려운 과제는 개별 부품을 만드는 것이 아니라 텍스트·음성·이미지를 하나의 유기적인 구조로 통합해 동시에 이해하고 생성하도록 설계하는 것"이라며 "이번 모델의 핵심 기여는 단순한 인코더 활용이 아니라 이러한 통합 아키텍처를 완성한 데 있다"고 말했다.
이어 "이미 표준화된 고성능 인코더를 활용해 전체 모델의 완성도와 안정성을 높이는 것은 글로벌 AI 업계에서 시스템 확장성을 위한 보편적인 설계 방식"이라며 "이는 기술 자립도가 부족해서가 아니라, 가장 효율적이고 신뢰할 수 있는 성능을 구현하기 위한 고도의 엔지니어링 판단"이라고 덧붙였다.
네이버클라우드는 관련 기술적 선택과 라이선스 정보도 허깅페이스와 테크리포트를 통해 투명하게 공개해 왔다고 강조했다. 모델의 성능을 속이거나 기술적 기여를 과장하려는 의도는 없으며, 어떤 기술적 경로가 가장 효율적인 성능을 낼 수 있는지에 대한 고민의 결과를 공유한 것이라는 설명이다.
네이버클라우드는 앞으로도 기술 개발 전 과정에서 투명성을 유지하는 한편, 모든 요소를 직접 만들었는가라는 기준을 넘어 창의적인 통합을 통해 사용자에게 최고의 가치를 제공하는 데 집중할 계획이라고 밝혔다.
한편, 정부의 독자 파운데이션 모델 프로젝트를 둘러싼 유사성 논란은 앞서 국내 AI 기업 업스테이지가 개발한 모델을 두고도 제기된 바 있다. 당시 모델 일부 가중치의 유사성을 근거로 의혹이 제기됐으나, 공개 검증 과정과 추가 설명을 거치며 논쟁은 일단락됐다.
dconnect@newspim.com












