[서울=뉴스핌] 양태훈 기자 = 업스테이지는 3일, 자체 개발한 노코드 LLM(Large Language Model) 종합 평가 플랫폼 '이벨버스(Evalverse)'를 오픈소스로 무료 공개했다고 밝혔다.
이벨버스는 H6, MT-bench, EQ-bench, IFEval 등 LLM 성능 평가에 활용되는 주요 벤치마크를 한 곳에 통합해, 언어모델의 성능을 종합적으로 테스트할 수 있도록 설계됐다. 기존에는 특정 벤치마크 테스트를 위해 해당 플랫폼에 모델을 제출해야 했지만, 이벨버스를 활용하면 여러 벤치마크 테스트를 동시에 진행할 수 있다.
또한, 이벨버스는 업무용 메신저 '슬랙'과 연동돼 있어, 슬랙 내에서 챗봇과의 간단한 대화만으로 모델을 호출하고 테스트할 수 있다. 테스트 결과로 벤치마크별 점수와 종합 리포트를 제공받아 모델 간 비교 평가도 용이하다.
업스테이지 '이벨버스' 로고. [사진=업스테이지] |
업스테이지 측은 "이번 업스테이지의 이벨버스 오픈소스 공개는 생성형 AI 생태계의 발전과 상생을 위한 노력의 일환"이라며, "업스테이지는 한국어 LLM 평가 표준을 제시한 Open Ko-LLM 리더보드 구축, 복잡한 데이터 전처리 기술을 전면 공개한 데이터버스(Dataverse)에 이어 평가 플랫폼까지 전면 공개함으로써 독보적인 오픈소스 세계관을 완성했다"고 전했다.
dconnect@newspim.com