전체기사 최신뉴스 GAM
KYD 디데이
글로벌 미국·북미

속보

더보기

AI 최강자 등극 구글 '제미나이', GPT-4와 비교해 보니

기사입력 : 2023년12월07일 14:53

최종수정 : 2023년12월08일 07:49

[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개해 화제다.

지난해 11월 챗GPT로 생성형 AI의 미래를 제시한 오픈AI가 기술 최강 자리를 굳건히 지킬 것이란 예상이 GPT-4 출시 후 불과 약 9개월 만에 깨진 것이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지폈다.

◆ 제미나이의 강점은 '멀티 플레이어'

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '제미나이 울트라', 구글의 AI 챗봇 '바드'의 모델인 '제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

제미나이 프로는 제품 공개한 이날 바로 바드에 탑재됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다. 

'제미나이 울트라'는 내년 초 '바드 어드밴스드'라는 이름으로 바드에 장착되며, '제미나이 나노'는 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀8 프로'에 탑재된다.

구글은 제미나이가 "선천적"(natively)으로 멀티모달(Multi-Modal·다중모드) AI 모델이라고 소개한다. 멀티모달은 말그대로 텍스트뿐만 아니라 이미지, 동영상 등 비언어 입력값도 이해해 응용할 수 있는 '멀티 플레이어'다.

오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오 등 다양한 데이터로 제미나이를 훈련해왔다는 것이다.

제미나이가 학생의 물리학 문제를 풀이해주는 예시. [사진=구글 딥마인드 제공]

특히 제미나이는 이미지와 동영상을 이해한 데이터를 응용하고 상호 작용하는 데 강점을 보인다.

예컨대 한 학생이 물리학 문제를 풀이하는 과정을 펜으로 쓴 이미지를 교사가 제미나이 프롬프트에 넣어 문제 풀이 과정에 어떤 부분이 틀렸는지 질문하면 제미나이는 정확히 문제의 정답과 학생의 손 글씨를 이해해 잘못된 문제 풀이 과정을 수정해 준다.

구글 딥마인드는 "제미나이가 이미지 속 텍스트를 이해하는 것을 넘어 교사가 어떻게 문제를 다르게 설정했는지 등을 이해해야 가능하다"고 설명했다. 제미나이는 오답 풀이 뿐만 아니라 학생이 틀린 유형의 다른 연습 문제도 제공해 교육 환경에서의 활용도가 높다는 게 자체 평가다.

이 밖에 제미나이는 동영상 속 언어를 감지해 번역 자막을 달아주고, 동영상 속 상황을 이해해 질문에 답할 수 있다.

◆ 32개 벤치마크 테스트 중 30개, 최고 성적

이미지와 영상의 이해부터 수학적 추론까지 가능한 제미나이 울트라가 업계에서 LLM 연구개발 평가 시 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 뛰어넘는 성적을 기록했다.

구체적으로 제미나이 울트라는 텍스트와 추론 벤치마크 부문 12개 중 10개, 이미지 이해 부문 9개 중 9개, 동영상 이해 벤치마크 6개 중 6개, 음성 인식 부문 5개 중 5개에서 GPT-4보다 높은 신기록을 썼다.

특히 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 제미나이 울트라는 90% 이상의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

구글 딥마인드는 제미나이 울트라의 MMLU 점수가 GPT-4의 86.4%를 앞선 것에서 나아가 AI 모델로는 최초로 인간 전문가 점수인 89.8%를 뛰어넘었다고 밝혔다. 

이 밖에 여러 단계의 추론을 요구하는 여러 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard)와 독해력 벤치마크인 DROP에서 각각 80%가 넘는 점수로 GPT-4를 능가했다. 

WMT23 벤치마크는 LLM의 번역 능력을 평가한다. 제미나이 울트라는 74.40%로 GPT-4보다 번역 능력이 우수했다.

다만 일상에 필요한 상식 추론 능력을 보는 헬라스웨그(HellaSwag) 벤치마크에서는 제미나이 울트라가 GPT-4에 못미쳤다. 

제미나이 울트라의 이미지 이해 능력은 GPT-4 보다 뛰어났다.

과학, 기술, 인문 과학, 음악 등 6개 핵심 부문 대학교 시험과 교과서에서 수집된 차트, 표, 악보 이미지를 이해하는 능력을 평가하는 다소 새로운 벤치마크인 MMMU에서 제미나이 울트라는 59.4%를 기록, GPT-4를 앞섰다.

이미지를 보고 이해해 관련 질문에 답할 수 있는 능력을 확인하는 VQAv2 벤치마크와 서류상 이미지를 이해하는 능력을 보는 DocVQA, 그래프 등을 보고 수학적 추론 능력을 보는 매스 비스타(MathVista) 벤치마크에서도 GPT-4 보다 좋은 성적을 거뒀다.

AI 모델의 동영상 이해를 평가하는 벤치마크들에서도 제미나이 울트라는 두각을 보였다. 

영상 속 상황을 텍스트로 옮기는 능력을 평가하는 VATEX 벤치마크와 영상과 관련된 질문에 답해 전반적인 영상 이해도를 평가하는 인식 테스트 MCQA 벤치마크 모두 GPT-4를 뛰어넘었다. 

이밖에 중국어 텍스트로 영상 속 상황을 옮기는 능력을 평가하는 VATEX ZH, 영어로 복잡한 요리 과정이 담긴 영상을 텍스트로 옮기는 YouCook2 등 여러 벤치마크에서도 높은 성적을 거뒀다.

제미나이 프로의 음성 인식 이해도도 우수했다. 21개 언어의 음성을 인식해 텍스트로 변환하는 능력을 평가하는 CoVoST 2 벤치마크에서 제미나이 프로는 40.1을 기록, 오픈AI의 음성 인식 AI 모델 '위스퍼' 버전 2(v2) 보다 10 이상 높았다.

62개 언어로 음성 인식 여부를 확인하는 FLEURS 벤치마크에서도 제미나이 프로는 7.6%를 기록, 위스퍼 v3 보다 월등했다. FLEURS는 AI 모델이 음성 인식 정확도를 측정하는 테스트로 점수가 낮을 수록 인식 오류가 적다는 의미다. 

이밖에 제미나이는 파이선(Python), 자바(JAVA), C++, Go 등 세계에서 널리 사용되는 프로그래밍 언어로 코드를 이해하고 생성할 수 있다. 

코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval) 벤치마크에서 제미나이 울트라는 74.4%를 기록해 GPT-4(67.0%)를 능가했다. 파이썬 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 벤치마크에서도 GPT-4 보다 1%포인트(p) 높은 74.9%를 기록했다. 

[사진= 구글 홈페이지]

wonjc6@newspim.com

 

GAM - 해외주식 투자 도우미

[뉴스핌 베스트 기사]

사진
사직 전공의 2924명 복귀 의사 [세종=뉴스핌] 신도경 기자 = 20일부터 전공의를 대상으로 한 추가 모집이 시작된 가운데, 최소 사직 전공의 2924명이 복귀 의향을 밝힌 것으로 알려졌다.  이날 대한수련병원협의회(협의회)에 따르면 사직 전공의에 복귀 의향을 묻는 설문조사에 참여한 인원 4794명 중 복귀 의사를 밝힌 사직 전공의는 2924명(61.5%)으로 집계됐다. 복귀 의사를 밝힌 사직 전공의 2924명 중 즉시 복귀를 희망한 사직 전공의는 719명(15.1%)이다. 필수의료패키지 재논의, 5월 복귀 시 수련 인정, 입대한 사직자의 제대 후 복귀 TO(정원) 보장을 조건으로 복귀를 희망한 사직 전공의는 2205명(46.4%)으로 집계됐다. 복지부는 이달 말까지 전공의 추가 모집을 허용한다고 밝혔다. 전공의는 3월과 9월 상·하반기로 나눠 수련 모집을 하는데 의료계 요청에 따라 추가 복귀 길을 열어준 셈이다. 복지부는 사직전공의가 요구한 필수의료패키지 재논의, 5월 복귀 시 수련 인정, 입대한 사직자의 제대 후 TO 보장을 반영한다는 입장을 밝혔다. 필수의료패키지 재논의에 대해서는 기존 발표한 의료개혁 과제 중 구체화가 필요한 과제에 대해 현장의 목소리를 충분히 보완하겠다고 밝혔다. 5월 복귀 시 수련 인정의 경우는 오는 6월 1일부터 수련이 개시되면 인정된다. 군입대 전공의를 포함한 복귀 전공의 TO 보장도 수용됐다. 원 소속 병원·과목·연차의 TO가 기존 승급자 등으로 이미 채워진 경우도 사직자가 복귀하면 정원을 추가 인정한다. 다만, 이미 군입대한 전공의가 제대한 후 수련병원으로 복귀하는 문제는 향후 의료 인력, 병력 자원 수급 상황, 기존 복귀자와 형평성 등을 고려해 검토하겠다고 선을 그었다. 문제는 전공의 약 3000명이 복귀해도 전공의 출근자 비율은 2023년 전공의 임용대상자와 대비하면 절반에 못 미친다. 2023년 전공의 임용대상자는 1만3531명이다. 올해 3월 사직전공의 전체 인원은 1만1713명으로 재작년 대비 86.6%에 해당하는 전공의가 복귀하지 않고 있다. 만일 3000명이 복귀할 경우 2023년 대비 전공의 비율은 35.6%다. 복지부는 "대한수련병원협의회, 대한병원협회 등 6개 단체가 전문의 수급 차질을 막고 의료공백 상황을 해결할 수 있도록 사직전공의의 수련 복귀를 위한 추가 모집을 열어줄 것을 건의했다"며 "고심 끝에 수련 현장 건의를 받아들여 5월 중 수련 재개를 원하는 전공의는 개인의 선택에 따라 수련에 복귀할 수 있도록 기회를 부여하고자 하는 것"이라고 설명했다. sdk1991@newspim.com 2025-05-20 14:25
사진
SKT 재점화 '위약금 면제' 논의 [서울=뉴스핌] 김영은 인턴기자 = SK텔레콤(SKT) 해킹 사고로 유출된 정보가 당초 예상보다 더 많았던 것으로 밝혀지자, 유심 해킹 피해 고객 위약금 면제 논의에 다시 관심이 쏠리고 있다.  19일 'SKT 유심 해킹 사고 민·관 합동 조사단(민관합동조사단)'의 2차 조사 결과 브리핑에 따르면, 조사단은 SKT 서버에서 총 25종의 악성코드와 23대의 감염 서버를 추가로 확인했다. 조사단은 이번 사고로 약 2695만건 이상의 유심 정보(전화번호, 국제 이동 가입자 식별번호인 IMSI 등 약 9.82GB 규모) 유출을 확인했다.  조사단은 리눅스 서버 3만여대를 포함한 전체 서버로 점검 범위를 확대하고 있다. 조사단은 일부 서버에서 개인정보(이름, 생년월일, 전화번호, 이메일 등)와 단말기 고유식별번호(IMEI) 약 29만건이 포함된 파일을 발견해, 해당 정보의 유출 여부에 대해 추가 조사를 진행한다. 류정환 SKT 네트워크인프라센터장이 19일 데일리 브리핑에서 발언하고 있다. [사진= 정승원 기자] SKT를 이용하며 '2년 약정' 계약을 맺은 고객 김모(35)씨는 이날 통신사 변경 상담을 신청했다. 김씨는 "유심 정보 해킹 피해를 당한 피해자의 입장이지만, 약정 기간이 약 1년 3개월 남았다는 이유로 10만원을 내야 한다고 통보받았다"며 "SKT가 고객 신뢰를 회복하려면, 고객의 위약금 지불 부담부터 덜어야 하는 것 아니냐"고 지적했다.  비슷한 처지의 박모(27)씨도 약정(2년 약정) 만료를 약 1년 앞두고, 위약금 8만원을 안내받은 상황이다. 박씨는 "일 때문에 바빠서 전화 상담을 받았는데, 자세한 위약금 도출 과정은 물어보지 못했다"며 "해킹 피해로 금융 범죄 피해는 당하지 않을까 노심초사하고 있는데, 위약금 부담에 통신사 변경도 마음대로 하지 못해 억울하다"고 말했다.  SKT는 전날 이 같은 고객 의견을 이사회에 전달하기 위해 SKT 고객신뢰위원회를 만들었다고 밝혔다. 고객신뢰위원회는 최근 해킹 사고로 손상된 고객 신뢰를 회복하고, 장기적으로 고객 만족도를 높이기 위해 출범한 외부 전문가 중심의 독립 기구다.  홍승태 SKT고객가치혁신실장은 "위약금 면제와 관련해 고객의 생각을 정리해 회사에 전달하는 등 고객 시각을 반영하는 역할을 위원회가 맡을 것"이라고 설명했다. 다만 SKT 측은 위원회가 직접 위약금 면제를 결정하지는 않는다는 입장을 유지하고 있다.   ◆ 위약금 면제의 쟁점은 'SKT 귀책사유'…정부·법조계도 주목 [서울=뉴스핌] 김영은 인턴기자 = LTE·5G 이동전화 서비스 등 이용 고객을 대상으로 한 SKT 이용약관 제 43조(위약금 면제)에 따르면 '회사의 귀책 사유로 (고객이) 계약을 해지할 경우'가 위약금 면제 조건으로 명시돼 있다. [사진=SKT 약관 캡처] 2025.05.19 yek105@newspim.com 위약금 면제 여부를 결정할 핵심 기준은 'SKT의 귀책사유 여부'가 될 전망이다. LTE·5G 이동전화 서비스 등 이용 고객을 대상으로 한 SKT 이용약관 제 43조(위약금 면제)에 따르면 '회사의 귀책사유로 (고객이) 계약을 해지할 경우'가 위약금 면제 조건으로 명시돼 있다.  일각에서는 해당 조항이 현실화하기 어렵다는 의견이 제기됐다. 한 법조계 관계자는 "약관에서 말하는 귀책 사유란 계약상 급부 의무를 이행하지 못한 경우를 의미한다"며 "SKT는 통화나 데이터 등 통신 서비스를 정상적으로 제공한 만큼, 이번 사건이 위약금 면제 조건에는 해당하지 않는다"고 말했다.  민관합동조사단은 현재 회사의 귀책사유를 가리는 조사를 이어가고 있다. 조사단은 현재 유심 해킹 사고의 원인 및 경위, 피해 규모, 사내 보안 관리 실태, 사고 대응 과정의 적정성 등을 조사 중이다.  정부는 최종 조사 결과에 따라 위약금 면제 등 책임의 경중을 판단하겠다는 입장이다. 유상임 과학기술정보통신부 장관은 지난 9일 정부서울청사에서 열린 월례 브리핑에서 "4개 법무법인에 의뢰한 검토 결과를 받아봤지만 아직은 명확하게 답하기 어렵다"며 "결국은 조사단의 결과를 보고 나서야 판단할 수 있을 것"이라고 밝혔다.  법무법인은 SKT의 ▲고의 또는 과실 여부 ▲정보보호 기술 수준 ▲보안조치의 적정성 등을 기준으로 귀책 여부를 판단할 수 있는 기준을 제시했다. 정부는 이 같은 기준과 조사단 결과를 고려해, 행정 행위 수준을 결정지을 전망이다.  ◆ "6개월 내 분쟁조정 결과 나올 것"…소비자 집단행동은 '속도' [서울=뉴스핌] 김영은 인턴기자 = SKT 유심 정보 유출 사태 한국소비자원 집단분쟁조정신청서 [사진=이철우 변호사] 2025.05.19 yek105@newspim.com 정부 조사가 길어지는 사이, 일부 고객은 집단으로 행동에 나서고 있다. SKT 이용 고객 59명은 지난 9일 한국소비자원 소비자분쟁조정위원회에 통신사 이동 시 위약금 면제 및 1인당 30만원 배상을 골자로 하는 집단 분쟁 조정을 신청했다.  대표 신청자인 이철우 문화법률사무소 변호사는 이날 "현재 집단분쟁조정 신청이 접수돼 사건 번호가 부여됐으며, 전체 절차는 6개월 이내 결론이 날 것으로 보인다"며 "전체 소비자에게 위약금 면제를 비롯한 어떤 보상안이 마련된다는 전제하에 신청 금액의 일부가 지급될 가능성이 있다"고 내다봤다.  이 변호사는 약관의 규제에 관한 법률(약관법) 제5조 제2항("약관의 조항이 명확하지 아니한 경우에는 그 조항은 작성자에게 불리하게 해석한다")에 따라 소비자분쟁조정위가 SKT에 불리하게 약관을 해석해 위약금을 면제받을 수 있다는 입장이다. 현재 SKT의 약관에는 '회사의 귀책사유로 (고객이) 계약을 해지할 경우'만 명시돼 있을 뿐, 귀책사유가 구체적으로 규정돼있지 않다.  이 변호사는 "핵심은 '회사 귀책사유'에 대한 해석이다"라며 "SKT 측은 '서비스 이용이 불가능할 정도의 장애'가 있어야 회사의 귀책사유가 성립한다고 주장하겠지만, '약관법 제5조 제2항 '작성자 불이익의 원칙'에 따라, 귀책사유에 대한 부연 설명이 없을 때는 소비자에게 유리하게 해석해야 한다"고 설명했다.  ◆ 국회입법조사처 "SKT 정보 유출 계기로 '위약금 면제' 제도화해야" [서울=뉴스핌] 김영은 인턴기자 = 통신사 해킹 사고 사후대응의 문제점과 입법과제 [사진=국회입법조사처 캡처] 2025.05.19 yek105@newspim.com 국회입법조사처는 'SKT의 귀책사유'가 인정되기만 한다면 약관을 근거로 위약금을 면제할 수 있다는 입장이다. 국회입법조사처는 최근 '이동통신사 스스로 위약금을 면제하는 것이 법적으로 가능한지'를 묻는 최민희 국회 과학기술정보방송통신위원장(더불어민주당)의 질문에 "SKT가 가입 약관에서 '회사의 귀책사유로 인해 고객의 계약을 해지할 경우' 위약금 납부 의무를 면제하도록 규정하고 있으므로 이번 해킹사태가 SKT 귀책사유로 인한 서비스 문제라면 이 조항을 근거로 위약금을 면제할 수 있다"고 답했다. 이와 함께 국회입법조사처는 최근 '통신사 해킹 사고 사후대응의 문제점과 입법과제' 보고서를 통해 통신사 해킹 사고와 관련해 피해 소비자를 위한 위약금 면제를 법제화해야 한다고 제안했다. 입법조사처는 "(유심 해킹 사태 이후) SKT가 뒤늦게 유심 무상 교환 조치를 발표하고 유심 보호 서비스 가입자에게 피해가 발생할 경우 보상하겠다는 모호한 입장을 취한 것도 전기통신사업법, 개인정보 보호법, 정보통신망법에 피해자에 대한 실질적 구제 조치가 미흡한 현실을 보여준다"며 "피해자가 통신사 이동을 원할 경우, 위약금을 면제하는 조치를 취해야 한다"고 제언했다. 보고서를 작성한 박소영 변호사는 이날 "구체적으로는 정보통신망법의 '침해 사고 대응' 부분, 혹은 전기통신사업법상 '이용자 보호'나 '사업자 의무' 조항에 위약금 면제 내용을 추가할 수 있다"며 "또, 보고서에는 없지만 공정거래위원회가 관리하는 소비자 보호 지침도 다시 검토해볼 수 있다"고 덧붙였다. 한편, 2차 조사 결과 브리핑을 마친 류제명 과학기술정보통신부 네트워크정책실장은 "SKT 유심 해킹 사태 대응에 있어 철저한 조사, 투명한 절차, 그리고 국민 우선의 정보 공개라는 세 가지 원칙으로 임하고 있다"며 "절대 은폐하거나 축소하는 일은 없을 것"이라고 밝혔다. 조사단은 오는 6월 말까지 IMEI 등 민감정보 유출 여부, 전체 서버 추가 점검, 해킹 경위와 사내 보안 실태, 회사 귀책사유 등 핵심 쟁점에 대해 조사를 이어갈 계획이다. yek105@newspim.com 2025-05-19 20:58
안다쇼핑
Top으로 이동