전체기사 최신뉴스 GAM 라씨로
KYD 디데이
산업 중기·벤처

속보

더보기

크라우드웍스, 비즈니스 특화 SLM '웍스원' 개발

기사입력 : 2024년04월25일 13:53

최종수정 : 2024년04월25일 13:53

[서울=뉴스핌] 송은정 기자 =크라우드웍스는 SLM(소형언어모델)을 활용한 기업 맞춤형 생성형AI 수요가 늘어남에 따라 비즈니스 환경에 특화된 SLM '웍스원(WorksOne)'을 개발했다고 25일 밝혔다.

[사진=크라우드웍스]

크라우드웍스는 국내 여러 기업들이 요구하는 대형언어모델(LLM)을 구축하면서 영어 중심으로 학습된 LLM이 한국어는 물론 한국의 비즈니스 용어를 원활히 이해하지 못해 잦은 취약점이 발생함을 발견했다. 웍스원은 영어로 학습된 LLM에서 발생하는 데이터 격차의 문제를 해결한다. 

웍스원은 한국의 비즈니스 환경에 최적화된 모델이다. 70억 매개변수를 가진 오픈소스 모델과 1만개의 고품질 데이터셋으로 구현했다. 기업에서 선호하는 비즈니스 친화적(Business-friendly)인 답변을 제공한다는 점이 차별화된 강점이다.

이를 위해 비즈니스 맞춤형 데이터셋을 직접 구축해 모델을 최적화했다. 비즈니스 맞춤형 데이터셋은 금융, 유통, 공공기관 등 기업별 데이터 특징을 분석해 비즈니스 특화 용어, 문체, 보고 유형 등을 분석해 만들었다. 일반적으로 시중에는 번역된 데이터의 사용이 많고 학습 데이터의 원본이 한국어로 된 고품질 데이터를 찾아보기 힘들다. 이러한 번역된 데이터에는 번역 오류가 포함될 수 있다. 모델이 문맥을 잘못 이해하거나 부정확한 판단을 내릴 수 있다.

크라우드웍스는 이러한 문제를 해결하기 위해 고품질 데이터셋 구축부터 공을 들였다. 국내 최다 규모인 60만 데이터 작업자 풀을 기반으로 전문 역량을 가진 고급 데이터 작업자를 선발하고 비즈니스 언어 활용과 표현력, 문서 구조화 능력 등 자체 검증을 실시했다. 검증에  통과한 평균 경력 15년 이상의 대기업 기획 업무 경험을 가진 전문가들이 데이터셋 구축에  참여해 고품질 데이터를 직접 완성했다. 

웍스원은 기업 내부 시스템과 연동이 원활한 점도 강점이다. 웍스원은 지정한 키(Key) 값과 구조를 갖춘 JSON 형식의 답변을 안정적으로 출력할 수 있다. 사내 레거시 시스템과 쉽게 통합하고 확장하는 것이 용이해 시스템간 데이터 교환 및 상호운용성을 향상시킬 수 있다. 

자체 테스트 결과 GPT를 포함한 타 모델들의 경우 JSON 답변에 노이즈가 포함되거나 항목이 누락되는 결과를 확인했지만 웍스원은 요청한 키 값에 따라 안정적으로 답변을 생성했다. 띄어쓰기나 오타 하나만 발생해도 사용자가 전후처리에 상당한 리소스를 소모하기에 정확한 답변을 안정적으로 출력할 수 있는 것은 매우 중요하다. 

이형주 크라우드웍스 최고기술책임자(CTO)는 "웍스원은 비즈니스 용어 및 문서 환경에 대한 이해도가 높은 전문가가 직접 만든 한국어 데이터로 학습시킨 비즈니스 특화 모델로서 이러한 고품질 데이터로 학습한 모델은 업계에서 유일하다"며 "앞으로도 인공지능(AI) 데이터부터 LLM까지 기업 혁신에 필요한 모든 것을 제공하겠다"고 밝혔다.

yuniya@newspim.com

CES 2025 참관단 모집

[뉴스핌 베스트 기사]

사진
"尹 기자회견 대국민 사과 미흡" 71.2% [서울=뉴스핌] 이바름 기자 = 국민 10명 중 7명은 윤석열 대통령의 대국민 사과가 미흡하다고 생각하는 것으로 나타났다. 종합뉴스통신사 뉴스핌 의뢰로 여론조사 전문기관 미디어리서치가 지난 11일~12일 이틀간 전국 만 18세 이상 남녀 1002명을 대상으로 진행한 ARS 조사 결과 윤 대통령의 대국민 사과에 대해 '미흡했다(매우 미흡+다소 미흡)'고 응답한 비율이 71.2%로 집계됐다. '진정성 있다(다소 진정성+ 매우 진정성)'고 답변한 비율은 26.4%, '잘모름'은 2.4%로 나타났다.   '윤 대통령의 사과가 미흡했다'는 남녀 모두에서 과반을 넘었다. 남성은 64.9%, 여성은 62.9%가 '매우 미흡했다'고 답변했다. '다소 미흡했다'는 각각 8.3%, 6.2%였다. 남성 71.2%, 여성 69.1%가 윤 대통령 사과에 대해 '미흡했다'는 인식을 같이 하고 있는 셈이다. 연령별로 보면 1020세대와 40대가 특히 부정적으로 인식했다. 40대는 87.2%가 '미흡했다'고 답변했다. 구체적으로 '매우 미흡'이 81.0%, '다소 미흡'이 6.2%였다. '진정성 있다'는 12.3%로 '다소 진정성 있다'는 5.6%, '매우 진정성 있다'는 6.8%였다. '잘모름'은 0.5%였다. 만 18세~29세도 84.8%가 '미흡했다'고 응답했다. '매우 미흡'이 78.8%, '다소 미흡'이 6.0%로 나타났다. '진정성 있다'는 14.3%로 '다소 진정성 있다'가 2.4%, '매우 진정성 있다'는 11.9%였다. '잘모름'은 0.9%였다. 50대는 '미흡했다'가 75.2%(매우 미흡 69.6%, 다소 미흡 5.5%), '진정성 있다'는 23.5%(다소 진정성 7.0%, 매우 진정성 16.5%)로 조사됐다. '잘모름'은 1.3%였다. 30대는 '미흡했다' 68.2%(매우 미흡 62.2%, 다소 미흡 5.9%), '진정성 있다' 24.3%(다소 진정성 6.9%, 매우 진정성 17.5%), 잘모름 7.5%로 나타났다. 60대는 '미흡했다' 60.2%(매우 미흡 52.0%, 다소 미흡 8.1%), '진정성 있다' 38.4%(다소 진정성 17.7%, 매우 진정성 20.8%), '잘모름' 1.4%였다. 전 연령대에서 유일하게 70대 이상만 '진정성 있다'가 48.9%(다소 진정성 23.7%, 매우 진정성 25.3%)로, '미흡했다'고 응답한 46.9%(매우 미흡 34.4%, 다소 미흡 12.6%)를 앞질렀다. 지역별로는 광주·전남·전북이 '미흡했다'가 80.1%(매우 미흡 69.8%, 다소 미흡 10.3%)로 가장 많았다. '진정성 있다'는 16.5%(다소 진정성 7.1%, 매우 진정성 9.4%), '잘모름'은 3.4%였다. 다음으로 경기·인천은 '미흡했다' 74.8%(매우 미흡 69.3%, 다소 미흡 5.5%), '진정성 있다' 25.5%(다소 진정성 8.7%, 매우 진정성 15.8%), '잘모름' 0.7%였다. 서울은 '미흡했다' 74.2%(매우 미흡 64.3%, 다소 미흡 9.9%), '진정성 있다' 24.9%(다소 진정성 7.0, 매우 진정성 17.9%), '잘모름' 0.9%였다. 강원·제주는 '미흡했다' 71.0%(매우 미흡 66.2%, 다소 미흡 4.8%), '진정성 있다' 23.3%(다소 진정성 16.2%, 매우 진정성 7.1%), '잘모름' 5.7%로 나타났다. 부산·울산·경남은 '미흡했다' 65.9%(매우 미흡 55.4%, 다소 미흡 10.5%), '진정성 있다' 30.7%(다소 진정성 12.4%, 매우 진정성 18.3%), '잘모름' 3.4%였다. 대전·충청·세종은 '미흡했다' 64.7%(매우 미흡 61.0%, 다소 미흡 3.6%), '진정성 있다' 28.0%(다소 진정성 12.9%, 매우 진정성 15.1%), '잘모름' 7.3%로 조사됐다. 대구·경북은 '미흡했다' 59.4%(매우 미흡 54.6% 다소 미흡 4.8%), '진정성 있다' 38.5%(다소 진정성 15.8%, 매우 진정성 22.8%), '잘모름' 2.1%로 가장 낮았다. 지지정당별로는 여당을 제외하고 모두가 부정적인 답변이 많았다. 더불어민주당 지지자들은 윤 대통령의 사과가 '미흡했다'고 응답한 비율이 95.1%에 달했다. 이중 '매우 미흡'은 91.9%, '다소 미흡'은 3.1%였다. '진정성 있다'고 답변한 비율은 4.5%(다소 진정성 1.3%, 매우 진정성 3.2%)에 불과했다. '잘모름'은 0.4%였다. 반대로 국민의힘 지지자들은 62.6%가 '진정성 있다'고 대답했다. '다소 진정성이 있었다'는 26.1%, '매우 진정성이 있었다'가 36.7%로 집계됐다. '미흡했다'는 35.4%(매우 미흡 22.9%, 다소 미흡 12.4%), '잘모름'은 1.9%였다. 조국혁신당 지지자들은 '미흡했다' 95.8%(매우 미흡 94.7%, 다소 미흡 1.1%), '진정성 있다' 4.2%(다소 진정성 1.1%, 매우 진정성 3.1%)였다. 개혁신당은 '미흡했다' 90.0%(매우 미흡 77.9%, 다소 미흡 12.1%), '진정성 있다' 8.3%(다소 진정성 3.4%, 매우 진정성 4.9%), '잘모름' 1.7%였다. 진보당은 '미흡했다' 70.1%(매우 미흡 65.1%, 다소 미흡 5.0%), '진정성 있다' 29.9%(다소 진정성 2.3%, 매우 진정성 27.6%)로 조사됐다. 무당층은 '미흡했다' 78.6%(매우 미흡 71.3%, 다소 미흡 7.3%), '진정성 있다' 9.4%(다소 진정성 6.0%, 매우 진정성 3.4%), '잘모름' 12.0%였다. 국정지지별로는 '잘못하고 있다'는 응답자 중 94.8%가 '미흡했다'고 답변했다. '매우 미흡'이 87.9%, '다소 미흡'이 6.9%였다. '진정성 있다'는 3.1%(다소 진정성 2.0%, 매우 진정성 1.1%), 잘모름은 2.1%였다. 국정을 '잘 하고 있다' 응답자 중에서는 89.2%가 '진정성 있다'고 대답했다. '다소 진정성'은 32.5%, '매우 진정성'은 56.7%로 나타났다. '미흡했다'는 9.5%(매우 미흡 2.5%, 다소 미흡 7.0%), '잘모름'은 1.3%였다. 김대은 미디어리서치 대표는 "윤석열 대통령이 대국민담화 및 기자회견은 '끝장 회견'을 예고한 것과는 달리 국민이 원하는 '속 시원한' 대답은 나오지 않았다"며 "윤 대통령의 이날 답변은 대체로 두루뭉술하고 포괄적이었다"고 평가했다. 이어 "국민 앞에 고개는 숙였지만 정작 실제 답변에선 김건희 여사를 적극 두둔해 대국민사과 효과를 '반감'시켰다는 지적과 함께 문제 인식과 처방 모두에서 '국민 눈높이'에 크게 미흡 하다보니 이번에 조사한 대통령 국정지지율과 거의 비슷하게 나왔다"고 분석했다. 이번 여론조사는 성·연령·지역별 인구비례 할당 추출 방식으로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) ARS 전화조사 방식으로 실시했으며 응답률은 3.6%, 신뢰수준은 95%, 표본 오차는 ±3.1%p다. 통계보정은 2024년 1월말 행정안전부 주민등록 인구통계를 기준으로 성별 연령별 지역별 가중 값을 부여(셀가중)했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. right@newspim.com 2024-11-14 06:00
사진
尹지지율 26.9%…'기자회견 효과 보수결집' [서울=뉴스핌] 박성준 기자 = 윤석열 대통령의 지지율이 20%대 중후반을 기록했다는 여론조사 결과가 14일 발표됐다. 종합뉴스통신사 뉴스핌 의뢰로 여론조사 전문업체 미디어리서치가 지난 11일~12일 이틀간 전국 만 18세 이상 남녀 1002명에게 물은 결과 윤 대통령의 국정운영에 대한 긍정평가는 26.9%로 집계됐다. 부정평가는 71.5%로 나타났다. '잘 모름'에 답한 비율은 1.6%다. 긍정평가(26.9%)는 지난 조사와 달라지지 않았고 부정평가는 0.4%포인트(p) 하락했다. 긍정평가와 부정평가 간 격차는 44.6%p다. 연령별로 보면 40대에서 긍정평가와 부정평가 격차가 극명하게 드러났다. 만 18세~29세에서 '잘함'은 17.1% '잘 못함' 81.1%였고, 30대에서는 '잘함' 21.3% '잘 못함' 77.2%였다. 40대는 '잘함' 10.8% '잘 못함' 88.3%, 50대는 '잘함' 24.2% '잘 못함' 75.4%로 집계됐다. 60대는 '잘함' 40.7% '잘 못함' 56.9%였고, 70대 이상에서는 '잘함' 50.8% '잘 못함' 46.2%로 집계됐다. 지역별로는 서울 '잘함' 23.6%, '잘 못함'은 73.8%로 집계됐다. 경기·인천 '잘함' 24.3% '잘 못함' 74.8%, 대전·충청·세종 '잘함' 27.3% '잘 못함' 72.1%, 강원·제주 '잘함' 14.8% '잘 못함' 74.8%로 조사됐다. 부산·울산·경남 '잘함' 33.3% '잘 못함' 65.0%, 대구·경북은 '잘함' 42.1% '잘 못함' 55.9%로 집계됐다. 전남·광주·전북은 '잘함' 18.3% '잘 못함' 79.9%로 나타났다. 성별로도 남녀 모두 부정평가가 우세했다. 남성은 '잘함' 26.2% '잘 못함' 72.6%, 여성은 '잘함' 27.6% '잘 못함' 70.4%였다. 김대은 미디어리서치 대표는 "기자회견에서 김건희 여사 관련 의혹에 대해 제대로 된 해명 대신 감싸기에만 급급했고, 명태균 씨 논란에 대한 해명도 제대로 되지 않아 결과적으로 불신만 더 키운 꼴이 됐다"며 "하지만 60-70대 이상과 영남권 등 전통적인 지지층에서는 탄핵 등의 위기감이 높아져 지지율이 오히려 상승했다"고 해석했다. 그러면서 "며칠 전 미국 대선에서 트럼프 전 대통령이 당선되면서 안보와 경제 등 위기감 고조로 보수층이 결집하며 추가적인 지지율 추락을 막을 수 있었다"고 덧붙였다. 차재권 부경대 정치외교학과 교수는 "기자회견에 대해 긍정평가와 부정평가가 동시에 존재한다"며 "형식적으로나마 기자회견을 하고 사과를 했다는 점에서 만족하는 보수 지지층이 있다"고 말했다. 이어 "지지율 자체는 큰 변동이 없지만 (이번 기자회견 때문에) 부정평가한 사람들이 나중에라도 다시 긍정평가할 가능성이 더 낮아졌다"이라며 "앞으로 지지율이 개선될 가능성은 거의 없다"고 분석했다. 이번 여론조사는 성·연령·지역별 인구비례 할당 추출 방식으로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) ARS 전화조사 방식으로 실시했으며 응답률은 3.6%, 표본오차는 95% 신뢰수준에 ±3.1%p다. 통계보정은 2024년 1월말 행정안전부 주민등록 인구통계를 기준으로 성별 연령별 지역별 가중 값을 부여(셀가중)했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. parksj@newspim.com 2024-11-14 06:00
안다쇼핑
Top으로 이동