블랙웰 GPU 기반 추론 성능 강화…100만 토큰 컨텍스트 지원
[서울=뉴스핌] 김가희 기자 = 엔비디아(NVIDIA)가 에이전트형 인공지능(AI) 시스템을 겨냥한 신규 오픈 모델을 공개하고 AI 클라우드 기업에 대규모 투자를 단행하며 AI 인프라 확대에 나섰다.
엔비디아는 11일(현지시간) 에이전트 AI용 오픈 모델 '네모트론3 슈퍼(Nemotron 3 Super)'를 공개하고, AI 클라우드 기업 네비우스(Nebius)에 20억달러를 투자하는 전략적 파트너십을 발표했다.

네모트론3 슈퍼는 약 1200억개 파라미터 규모의 하이브리드 전문가혼합(MoE) 구조 기반 모델이다. 추론 과정에서 약 120억개의 파라미터만 활성화하도록 설계돼 효율성을 높였다.
엔비디아에 따르면 해당 모델은 이전 세대 모델 대비 최대 5배 높은 처리량과 약 2배 개선된 정확도를 제공한다. 최대 100만 토큰의 컨텍스트 윈도를 지원해 복잡한 멀티 에이전트 작업에서도 긴 문맥을 유지할 수 있도록 했다. 다중 토큰 예측 기술을 적용해 추론 속도도 기존 대비 약 3배 향상됐다.
해당 모델은 엔비디아의 최신 블랙웰(Blackwell) GPU에서 NVFP4 정밀도로 구동되며 이전 세대인 호퍼(Hopper) GPU보다 최대 4배 빠른 추론 성능을 제공한다.
현재 모델은 허깅 페이스(Hugging Face)와 오픈라우터(OpenRouter) 등을 통해 제공되며 AI 검색 서비스 퍼플렉시티(Perplexity) AI에서도 활용되고 있는 것으로 알려졌다.
엔비디아는 같은 날 네덜란드 암스테르담에 본사를 둔 AI 클라우드 기업 네비우스에 20억달러 규모 투자를 진행한다고 밝혔다.
CNBC 등에 따르면 엔비디아는 네비우스와 전략적 협력 관계를 구축하고 AI 인프라 구축과 서버 운영 관리, 추론(inference), AI 데이터센터 설계 등 다양한 분야에서 협력할 계획이다. 엔비디아는 이번 투자가 네비우스의 기술력과 사업 모델에 대한 신뢰를 반영한 것이라고 설명했다.
한편 이번 발표는 엔비디아 연례 개발자 행사인 NVIDIA GTC 개막을 앞두고 공개됐다. 오는 16일 열리는 GTC에서 젠슨 황 엔비디아 최고경영자(CEO)는 기조연설을 통해 가속 컴퓨팅과 피지컬 AI 등 차세대 기술 로드맵을 제시할 예정이다.
rkgml925@newspim.com













