전체기사 최신뉴스 GAM 라씨로
KYD 디데이
경제 과학기술

속보

더보기

KAIST, GPT-4 버전의 시각 멀티모달 성능 뛰어넘는 대형 언어모델 개발

기사입력 : 2024년06월20일 10:52

최종수정 : 2024년06월20일 10:52

공개형 멀티모달 LLM 'CoLLaVO'·'MoAI' 개발

[세종=뉴스핌] 이경태 기자 = 한국과학기술원(KAIST)은 전기및전자공학부 노용만 교수 연구팀이 오픈AI(OpenAI)의 GPT-4 등 기업에서 비공개하고 있는 상업 모델인 초대형 언어모델의 시각 성능을 뛰어넘는 공개형 멀티모달 대형 언어모델을 개발해 출시했다고 20일 밝혔다.

노용만 교수 연구팀은 단순히 모델의 크기를 키우거나 고품질의 시각적 지시 조정 데이터셋을 만들지 않고 멀티모달 대형언어모델의 시각 성능을 획기적으로 높인 콜라보(CoLLaVO), 모아이(MoAI) 2가지 기술을 연속적으로 개발했다.

MoAI 멀티모달 대형언어모델 성능 [자료=한국과학기술원] 2024.06.20 biggerthanseoul@newspim.com

연구팀이 개발한 첫번째 기술인 '콜라보(CoLLaVO)'는 현존하는 공개형 멀티모달 대형언어모델이 비공개형 모델의 성능에 비해 현저하게 낮은 이유를 일차적으로 물체 수준에 대한 이미지 이해 능력이 현저하게 떨어진다는 것을 먼저 검증했다.

해당 능력을 효율적으로 증가시켜 시각-언어 태스크에 대한 성능을 향상 하기 위해 연구팀은 이미지 내의 정보를 배경과 물체 단위로 분할하고 각 배경 및 물체에 대한 정보를 멀티모달 대형언어모델에 입력으로 직접 넣어주는 새로운 방법인 '크레용 프롬프트(Crayon Prompt)'라는 시각적 프롬프트를 새롭게 제안했다.

시각적 지시 조정 단계에서 크레용 프롬프트로 학습한 정보를 잃어버리지 않기 위해 연구팀은 물체 수준 이미지 이해 능력과 시각-언어 태스크 처리 능력을 서로 다른 파라미터로 학습해 서로 간의 정보를 잃지 않게 만드는 획기적인 학습 전략인 '듀얼 큐로라(Dual QLoRA)'를 제안했다.

연구팀은 이를 통해 콜라보(CoLLaVO) 멀티모달 대형언어모델은 이미지 내에서 배경 및 물체를 구분하는 능력이 뛰어나 일차원적인 시각 구분 능력이 크게 향상됐다고 전했다.

두 번째 대형언어모델인 '모아이(MoAI)'는 인간이 사물을 판단할 때 물체의 존재, 상태, 물체 간의 상호작용, 배경에 대한 이해, 텍스트에 대한 이해 등으로부터 상황을 판단하는 인지과학적인 요소에 영감을 받아서 만들었다는 게 연구팀의 설명이다.

기존 멀티모달 대형언어모델은 텍스트에 의미적으로 정렬된 시각 인코더(vision encoder)만을 사용한다. 이미지 픽셀 수준에서의 상세하고 종합적인 실세계 장면 이해가 부족하다는 점을 연구팀은 지적했다. 연구팀은 이런 컴퓨터 비전 모델들의 결과를 받으면 모두 인간이 이해할 수 있는 언어로 변환한 뒤에 멀티모달 대형언어모델에 입력으로 직접 사용했다.

노용만 교수는 "연구팀에서 개발한 공개형 멀티모달 대형언어모델이 허깅페이스 일간 화제의 논문(Huggingface Daily Papers)에 추천됐고, 각종 SNS를 통해 세계 연구자에게 알려지고 있다"며 "모든 모델을 공개형 대형언어모델로 출시 했기 때문에 이 연구모델이 멀티모달 대형언어모델 발전에 기여할 것"이라고 말했다.

biggerthanseoul@newspim.com

[뉴스핌 베스트 기사]

사진
비트코인 9만달러 밑으로 급격히 후퇴 [뉴욕=뉴스핌] 김민정 특파원 = 비트코인 가격이 3일(현지시간) 9% 넘게 급락해 8만5000달러대로 레벨을 낮췄다. 도널드 트럼프 미국 대통령이 가상자산을 전략적으로 비축하겠다고 밝혔지만, 정치적 계산이며 실제로 가격을 띄우기 어렵다는 회의론이 제기되고 관세 정책에 따른 경기 둔화가 우려되면서 가상자산은 일제히 약해졌다. 비트코인 가격은 이날 미국 동부 시간 오후 3시 48분 기준 24시간 전보다 9.12% 급락한 8만5518.83달러를 가리켰다. 이더리움도 15%나 내린 2100달러선에서 거래됐다. 트럼프 대통령은 지난 주말 자신의 사회관계망서비스(SNS) 트루스 소셜을 통해 "미국의 가상자산 비축이 바이든 정부의 수년간에 걸친 부패한 공격 이후 위기에 빠진 이 산업을 상승시킬 것"이라며 가상자산 전략 비축이 비트코인, 이더리움을 중심으로 이뤄질 것이며 리플과 솔라나, 카르다노도 여기에 포함될 것이라고 설명했다. 이 같은 발언은 가상자산의 가파른 랠리로 이어졌다. 비트코인은 지난달 28일 7만 달러 대로 내렸다가 트럼프 대통령의 발언 이후 약 20% 급등했다. 하지만 트럼프 대통령이 실제로 비트코인 등 가상자산을 실제로 전략적으로 비축하기 어렵다는 진단이 나오고 주식 등 위험 자산도 트럼프 대통령의 관세 발효 확인으로 무너지면서 비트코인 역시 낙폭을 늘렸다. 트럼프 대통령은 예정대로 4일부터 캐나다와 멕시코산 수입품에 25%의 관세를 적용하겠다고 밝혔다. 주식시장이 트럼프 대통령의 관세 발표와 함께 급락세를 보이고 있는 점도 가상자산 투자 심리에 영향을 준 것으로 보인다. 정규장 막바지인 미국 동부 시간 3시 54분 뉴욕증시에서 3대 지수는 1.7~2.9%의 약세를 보이고 있다. IG의 토니 시카모어 시장 분석가는 트럼프 대통령의 발표가 우려를 키웠다고 진단하고 "준비금의 가상화폐 구매 자금이 미국 납세자에서 올 수도 있고 자산에는 있는 가상화폐는 법 집행 조치에서 압류된 것일 수도 있다"고 설명했다. 그러면서 "후자의 경우 시장에 새로운 매수가 유입되는 게 아니라 계좌 간의 단순한 이전을 나타낼 뿐이기 때문에 그렇게 낙관적이지 않다"고 지적했다. 비트코인 이미지 [사진=로이터 뉴스핌] mj72284@newspim.com 2025-03-04 06:00
사진
국민의힘 42.1%·민주 41.3% '재역전' [서울=뉴스핌] 한태희 기자 = 30대와 서울 민심이 요동치며 국민의힘 지지율이 더불어민주당(민주당) 지지율을 오차 범위 안에서 다시 앞선 것으로 조사됐다. 종합뉴스통신사 뉴스핌이 여론조사 전문기관 미디어리서치에 의뢰해 지난 26일 낮 12시30분부터 밤 10시까지 전국 만 18세 이상 남녀 1002명을 대상으로 진행해 발표한 자동 응답시스템(ARS) 조사에서 '어느 정당을 지지하거나 약간이라도 더 호감을 가지고 있냐'는 질문에 국민의힘 지지율은 직전 조사(39.7%) 대비 2.4%포인트(p) 오른 42.1%로 나타났다. 민주당 지지율은 직전 조사(42.3%) 대비 1%p 떨어진 41.3%다. 같은 기간 조국혁신당은 3.5%→2.8%로 0.7%p 하락했다. 개혁신당은 2.3%에서 2.0%로 0.3%p 떨어졌다. 진보당은 0.7%에서 0.9%로 0.2%p 올랐다. 기타 다른 정당은 3.1%에서 1.9%로 1.2%p 하락했다. 지지 정당 없음은 7.6%에서 8.1%로 0.5%p 늘었고 잘모름은 0.6%에서 0.9%로 0.3%p 올랐다. [서울=뉴스핌] 한태희 기자 = 2025.02.27 ace@newspim.com 연령별로 보면 만 18~29세와 30대, 60대 이상은 국민의힘 지지도가 높았다. 40~50대는 민주당을 더 지지했다. 지난 조사와 비교하면 30대에서 국민의힘 지지도가 민주당을 다시 앞섰다. 만 18~29세 정당 지지도를 보면 국민의힘 45%, 민주당 34.6%, 개혁신당 5.8%, 조국혁신당 3.1%, 진보당 1.9%, 기타 다른 정당 0.6%, 지지 정당 없음 8.1%, 잘모름 0.8% 등이다. 직전 조사와 비교하면 국민의힘은 39.6%에서 45%로 5.4%p 올랐고 민주당은 36.9%에서 34.6%로 2.3%p 떨어졌다. 30대는 국민의힘 41.3%, 민주당 35.4%, 개혁신당 3.6%, 조국혁신당 3.3%, 기타 다른 정당 4.5%, 지지 정당 없음 11.3%, 잘모름 0.7% 등이다. 직전 조사 대비 국민의힘은 35.2%에서 41.3%로 6.1%p 올랐고 민주당은 41.3%에서 35.4%로 5.9%p 하락했다. 40대는 민주당 54.1%, 국민의힘 30.3%, 조국혁신당 2.6%, 개혁신당 1.1%, 기타 다른 정당 2.8%, 지지 정당 없음 7.0%, 잘모름 2.1% 등이다. 50대는 민주당 46.8%, 국민의힘 36.6%, 조국혁신당 4.6%, 개혁신당 0.9%, 기타 다른 정당 1.2%, 지지 정당 없음 8.0%, 잘모름 0.5% 등이다. 60대는 국민의힘 46.3%, 민주당 39.7%, 조국혁신당 2.2%, 개혁신당 1.1%, 기타 다른 정당 1.6%, 지지 정당 없음 8.5%, 잘모름 0.6% 등이다. 70대 이상은 국민의힘 56%, 민주당 34%, 조국혁신당 0.6%, 진보당 2.0%, 기타 다른 정당 1.1%, 지지 정당 없음 5.7%, 잘모름 0.6% 등이다. 지역별로 보면 직전 조사와 비교해 서울에서 국민의힘이 민주당을 다시 앞섰다. 서울은 국민의힘 43.7%, 민주당 35.4%, 개혁신당 3.8%, 조국혁신당 3.1%, 진보당 1.0%, 기타 다른 정당 2.1%, 지지 정당 없음 9.7%, 잘모름 1.2% 등이다. 경기·인천은 민주당 45.8%, 국민의힘 38.7%, 조국혁신당 2.0%, 개혁신당 1.7%, 진보당 0.9%, 기타 다른 정당 0.6%, 지지 정당 없음 10.0%, 잘모름 0.3% 등이다. 대전·충청·세종은 국민의힘 43.5%, 민주당 39.2%, 조국혁신당 1.8%, 개혁신당 2.6%, 진보당 0.8%, 기타 다른 정당 5.6%, 지지 정당 없음 6.6% 등이다. 강원·제주는 국민의힘 39.4%, 민주당 35.7%, 조국혁신당 8.8%, 진보당 2.4%, 기타 다른 정당 2.4%, 지지 정당 없음 8.8%, 잘모름 2.4% 등이다. 부산·울산·경남은 국민의힘 48.8%, 민주당 36.7%, 조국혁신당 4.0%, 개혁신당 0.6%, 기타 다른 정당 2.9%, 지지 정당 없음 4.6%, 잘모름 2.4% 등이다. 대구·경북은 국민의힘 53.4%, 민주당 31.1%, 조국혁신당 2.8%, 개혁신당 1.0%, 진보당 1.0%, 기타 다른 정당 1.5%, 지지 정당 없음 8.3%, 잘모름 0.9% 등이다. 광주·전남·전북은 민주당 59.6%, 국민의힘 28.5%, 조국혁신당 1.9%, 개혁신당 3.1%, 진보당 0.9%, 기타 다른 정당 0.9%, 지지 정당 없음 5.1% 등이다. 성별로 보면 남성은 국민의힘 41.8%, 민주당 41.4%, 개혁신당 2.7%, 조국혁신당 4.0%, 진보당 0.8%, 기타 다른 정당 1.5%, 지지 정당 없음 7.1%, 잘모름 0.6% 등이다. 여성은 국민의힘 42.5%, 민주당 41.2%, 조국혁신당 1.6%, 개혁신당 1.3%, 진보당 0.9%, 기타 다른 정당 2.3%, 지지 정당 없음 9.0%, 잘모름 1.1% 등이다. 박상병 정치평론가는 "40~70대 이상은 지지하는 정당 입장이 확실한 반면 20~30대는 여론이 유동적"이라며 "여론조사 추이는 과대 표집이 줄어들고 비정상적인 모습이 정상으로 가는 과정"이라고 분석했다. 이번 조사는 무선 무작위 전화걸기(RDD) 활용 ARS를 통해 진행됐다. 신뢰 수준은 95%, 표본 오차는 ±3.1%p. 응답률은 6.2%다. 자세한 조사 개요 및 내용은 미디어리서치 홈페이지와 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다.   ace@newspim.com 2025-02-27 12:00
안다쇼핑
Top으로 이동