저전력·저비용으로 기업 부담 줄여
부동 소수점 연산 가능한 국내 최초 AI 반도체
[서울=뉴스핌] 조수빈 기자 = "KT 클라우드는 통신 사업자로 클라우드, 데이터센터(IDC), 네트워크 사업을 다 갖춘 유일한 클라우드 기업이라는 차별점이 있습니다. 하지만 이 부분이 사업적인 강점으로 연결되려면 또 다른 전략이 필요하죠. KT 클라우드는 AI(인공지능) 반도체 국산화를 시작으로 다양한 AI 응용 서비스를 아우르는 AI 풀스택 사업자로 자리매김할 겁니다."
KT 클라우드 리벨리온의 '아톰'을 적용한 클라우드 기반 신경망처리장치(NPU) 인프라 서비스를 국내 최초로 상용화하고 지난 30일부터 서비스를 개시했다고 27일 밝혔다. 사진은 리벨리온의 아톰 칩이 적용된 KT 클라우드의 NPU 인프라 서비스. [사진=KT 클라우드] |
김주성 KT 클라우드 고객담당 상무가 27일 온라인으로 진행된 KT 클라우드 인프라 설명회에서 글로벌 AI 반도체 시장에 나서는 각오를 드러냈다.
이날 온라인 설명회에서는 KT 클라우드 담당자들과 리벨리온 관계자들이 나와 KT 클라우드와 토종 팹리스(반도체 설계 전문기업) 리벨리온이 협업해 만들어 갈 AI 반도체 국산화 현황을 짚었다.
◆저비용·저전력으로 경쟁력 강화…클라우드로 이용자 편의도 높여
챗GPT 등장 이후 생성형 AI 열풍 속에 덩달아 수혜를 본 것은 엔비디아다. 엔비디아의 세계 AI용 그래픽처리장치(GPU) 시장 점유율은 90%에 달한다. AI 활용도가 커질수록 엔비디아 GPU의 수요는 커질 수밖에 없기에 엔비디아가 주목받는 것은 자연스러운 흐름이나, 엔비디아의 GPU는 고비용·고전력이라는 치명적인 단점이 있다.
이태경 KT 클라우드 팀장은 "AI 사용량이 늘어나면서 비용도 많이 늘고 수요에 따라 데이터센터 등 관련 시설에서 배출되는 탄소배출량이 문제로 떠오르면서 GPU의 지속가능성에 대한 의문이 제기되고 있다"며 신경망처리장치(NPU)가 등장한 배경을 설명했다.
NPU는 인공지능(AI) 분야에 최적화된 AI 반도체로 불린다. 동급의 GPU 대비 연산 속도가 빠르고 전력 소모는 낮기에 사용자의 시간과 비용을 단축할 수 있기 때문이다.
KT 클라우드 역시 NPU 시장의 가능성을 높이 평가해 리벨리온의 NPU '아톰'을 탑재한 클라우드 기반 NPU 인프라를 국내 최초로 상용화했다. 클라우드 기반을 사용한 이유는 '사용자의 편의' 때문이다.
클라우드 기반 NPU 인프라는 클릭 몇 번으로 고객이 직접 자원을 생성하고, 연산 세션을 활용하고, 관리·모니터링 등을 할 수 있다. 사용자가 전용 포털을 통해 쉽고 간편하게 NPU를 사용한 AI 추론이 가능해지는 것이다. 필요할 때, 필요한 만큼 이용할 수 있는 환경을 제공할 수 있기 때문에 연구 기간이나 비용도 단축한다.
아톰 자체의 성능도 뛰어나다. 아톰은 금융 거래에 특화된 AI 반도체 '아이온'에 이어 리벨리온이 두번째로 선보이는 AI 반도체로, 국내 타 팹리스가 개발중인 2세대 NPU 수준의 성능을 이미 갖춘 상태라는 평가를 받는다.
이경재 리벨리온 사업총괄은 "타사에서 지원하지 못하는 부동 소수점 연산(컴퓨터 실수 인식법)이나 자연어를 다른 국어로 번역해주는 트랜스포머 언어모델 등을 지원하는 유일한 국산 NPU"라며 "성능 지표도 우수하고 영상처리나 언어모델 처리 속도도 빠르다. 전력 소모량도 적어 글로벌 기업과도 경쟁 가능한 수준이라고 평가한다"고 말했다.
이 팀장은 "KT 클라우드의 NPU 사업 방향성은 크게 AI 인프라 사업 허들 낮추기, 성공 레퍼런스 발굴, 정부 로드맵 조기 달성 기여로 나눌 수 있다"면서 "이 중에서 가장 중요한 것은 성공 레퍼런스 발굴이다. NPU가 GPU를 대체할 수 있다는 것을 입증할 서비스 성과와 전력·비용 측면의 효율성 확보가 과제로 남는다"고 설명했다.
구글 클라우드 등 글로벌 선도 기업과의 기술 격차 수준을 묻자 이 팀장은 "국내 기술과 어느 정도의 격차가 있는 것은 사실이지만 리벨리온뿐 아니라 국내 유수의 팹리스 기술 현황을 보면 그 간극은 빠른 시일 내 줄일 수 있을 것"이라며 자신감을 보였다. 다만 NPU가 우선적으로 사용되는 영역은 학습이 아닌 추론이기 때문에 학습에도 사용되는 기존 GPU와 직접적인 비교는 어렵다는 것이 KT 클라우드 측의 설명이다.
이 팀장은 "현재는 AI 반도체 기술력 검증대회인 엠엘퍼프(MLPerf) 등의 결과를 사용해 간접적으로 효율을 증명하고 있으나 향후에는 공인 측정법을 마련해 사용자들의 직접 비교가 가능하게 할 것"이라고 부연했다.
K-클라우드 프로젝트 1단계 '국산 NPU 데이터센터 구축사업' 개요. [자료=과학기술정보통신부] |
◆대한민국을 NPU 생산거점으로...정부가 힘 싣는다
KT 클라우드와 리벨리온의 협업은 정부의 NPU 육성 사업과도 궤를 같이 한다. KT 클라우드와 리벨리온은 과학기술정보통신부가 추진하는 K-클라우드 사업의 참여 기업이다. 'K-클라우드 프로젝트'는 1단계 NPU(신경망처리장치), 2단계 저전력 PIM(프로세싱인메모리), 3단계 극저전력 PIM으로 2030년까지 세 단계에 걸쳐 추진된다.
이번에 추진되는 1단계는 국산 NPU를 데이터센터에 적용하고 클라우드 기반 AI 서비스까지 제공하는 실증 사업이다. 국산 NPU 데이터센터 구축사업은 AI반도체 팜 구축 및 실증 사업(민간)과 AI반도체 시험검증 환경조성 사업(공공, 광주 AI집적단지)으로 나뉘어 진행된다. 공고 당시 각 사업당 목표는 '연산용량 10PF(페타플롭스, 1PF는 1초에 1천조번 연산) 이상'이었으나 참여기업들의 의지로 각 데이터센터 연산용량이 2배로 확대돼 총 39.9PF 규모로 착수하게 됐다.
KT 클라우드는 민간과 공공 부문에 총 연산 용량 8.9PF 규모 국산 AI반도체 기반 데이터센터 및 클라우드 플랫폼을 구축하기로 했다. 이어 국산 AI반도체, SW스택, 클라우드 플랫폼, AI 응용서비스까지 어우르는 AI 풀스택(Full-stack)을 완성해 2025년까지 글로벌 시장에 진출하겠다는 목표를 세웠다. 초거대 AI인 '믿음'의 국산 AI반도체 기반 상용화 가능성도 이번 사업에 연계해 검증한다.
KT 클라우드는 "NPU 인프라는 K-클라우드 프로젝트 내 'AI바우처 지원사업'과 '고성능컴퓨팅 지원사업' 대상 기업에 먼저 제공하고 올해 하반기 중 기업 고객 대상으로 확대할 계획"이라고 설명했다.
beans@newspim.com