전체기사 최신뉴스 GAM
KYD 디데이
글로벌 미국·북미

속보

더보기

AI 최강자 등극 구글 '제미나이', GPT-4와 비교해 보니

기사입력 : 2023년12월07일 14:53

최종수정 : 2023년12월08일 07:49

※ 본문 글자 크기 조정

  • 더 작게
  • 작게
  • 보통
  • 크게
  • 더 크게

※ 번역할 언어 선택

[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개해 화제다.

지난해 11월 챗GPT로 생성형 AI의 미래를 제시한 오픈AI가 기술 최강 자리를 굳건히 지킬 것이란 예상이 GPT-4 출시 후 불과 약 9개월 만에 깨진 것이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지폈다.

◆ 제미나이의 강점은 '멀티 플레이어'

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '제미나이 울트라', 구글의 AI 챗봇 '바드'의 모델인 '제미나이 프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

제미나이 프로는 제품 공개한 이날 바로 바드에 탑재됐다. 제미나이 프로가 적용된 바드는 170개 이상 국가 및 지역에서 영어로 제공되며, 향후 서비스 확장 및 새로운 지역과 언어도 지원될 예정이다. 

'제미나이 울트라'는 내년 초 '바드 어드밴스드'라는 이름으로 바드에 장착되며, '제미나이 나노'는 구글이 지난 10월 공개한 최신 스마트폰인 '픽셀8 프로'에 탑재된다.

구글은 제미나이가 "선천적"(natively)으로 멀티모달(Multi-Modal·다중모드) AI 모델이라고 소개한다. 멀티모달은 말그대로 텍스트뿐만 아니라 이미지, 동영상 등 비언어 입력값도 이해해 응용할 수 있는 '멀티 플레이어'다.

오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오 등 다양한 데이터로 제미나이를 훈련해왔다는 것이다.

제미나이가 학생의 물리학 문제를 풀이해주는 예시. [사진=구글 딥마인드 제공]

특히 제미나이는 이미지와 동영상을 이해한 데이터를 응용하고 상호 작용하는 데 강점을 보인다.

예컨대 한 학생이 물리학 문제를 풀이하는 과정을 펜으로 쓴 이미지를 교사가 제미나이 프롬프트에 넣어 문제 풀이 과정에 어떤 부분이 틀렸는지 질문하면 제미나이는 정확히 문제의 정답과 학생의 손 글씨를 이해해 잘못된 문제 풀이 과정을 수정해 준다.

구글 딥마인드는 "제미나이가 이미지 속 텍스트를 이해하는 것을 넘어 교사가 어떻게 문제를 다르게 설정했는지 등을 이해해야 가능하다"고 설명했다. 제미나이는 오답 풀이 뿐만 아니라 학생이 틀린 유형의 다른 연습 문제도 제공해 교육 환경에서의 활용도가 높다는 게 자체 평가다.

이 밖에 제미나이는 동영상 속 언어를 감지해 번역 자막을 달아주고, 동영상 속 상황을 이해해 질문에 답할 수 있다.

◆ 32개 벤치마크 테스트 중 30개, 최고 성적

이미지와 영상의 이해부터 수학적 추론까지 가능한 제미나이 울트라가 업계에서 LLM 연구개발 평가 시 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 뛰어넘는 성적을 기록했다.

구체적으로 제미나이 울트라는 텍스트와 추론 벤치마크 부문 12개 중 10개, 이미지 이해 부문 9개 중 9개, 동영상 이해 벤치마크 6개 중 6개, 음성 인식 부문 5개 중 5개에서 GPT-4보다 높은 신기록을 썼다.

특히 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 제미나이 울트라는 90% 이상의 정답률을 기록했다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

구글 딥마인드는 제미나이 울트라의 MMLU 점수가 GPT-4의 86.4%를 앞선 것에서 나아가 AI 모델로는 최초로 인간 전문가 점수인 89.8%를 뛰어넘었다고 밝혔다. 

이 밖에 여러 단계의 추론을 요구하는 여러 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard)와 독해력 벤치마크인 DROP에서 각각 80%가 넘는 점수로 GPT-4를 능가했다. 

WMT23 벤치마크는 LLM의 번역 능력을 평가한다. 제미나이 울트라는 74.40%로 GPT-4보다 번역 능력이 우수했다.

다만 일상에 필요한 상식 추론 능력을 보는 헬라스웨그(HellaSwag) 벤치마크에서는 제미나이 울트라가 GPT-4에 못미쳤다. 

제미나이 울트라의 이미지 이해 능력은 GPT-4 보다 뛰어났다.

과학, 기술, 인문 과학, 음악 등 6개 핵심 부문 대학교 시험과 교과서에서 수집된 차트, 표, 악보 이미지를 이해하는 능력을 평가하는 다소 새로운 벤치마크인 MMMU에서 제미나이 울트라는 59.4%를 기록, GPT-4를 앞섰다.

이미지를 보고 이해해 관련 질문에 답할 수 있는 능력을 확인하는 VQAv2 벤치마크와 서류상 이미지를 이해하는 능력을 보는 DocVQA, 그래프 등을 보고 수학적 추론 능력을 보는 매스 비스타(MathVista) 벤치마크에서도 GPT-4 보다 좋은 성적을 거뒀다.

AI 모델의 동영상 이해를 평가하는 벤치마크들에서도 제미나이 울트라는 두각을 보였다. 

영상 속 상황을 텍스트로 옮기는 능력을 평가하는 VATEX 벤치마크와 영상과 관련된 질문에 답해 전반적인 영상 이해도를 평가하는 인식 테스트 MCQA 벤치마크 모두 GPT-4를 뛰어넘었다. 

이밖에 중국어 텍스트로 영상 속 상황을 옮기는 능력을 평가하는 VATEX ZH, 영어로 복잡한 요리 과정이 담긴 영상을 텍스트로 옮기는 YouCook2 등 여러 벤치마크에서도 높은 성적을 거뒀다.

제미나이 프로의 음성 인식 이해도도 우수했다. 21개 언어의 음성을 인식해 텍스트로 변환하는 능력을 평가하는 CoVoST 2 벤치마크에서 제미나이 프로는 40.1을 기록, 오픈AI의 음성 인식 AI 모델 '위스퍼' 버전 2(v2) 보다 10 이상 높았다.

62개 언어로 음성 인식 여부를 확인하는 FLEURS 벤치마크에서도 제미나이 프로는 7.6%를 기록, 위스퍼 v3 보다 월등했다. FLEURS는 AI 모델이 음성 인식 정확도를 측정하는 테스트로 점수가 낮을 수록 인식 오류가 적다는 의미다. 

이밖에 제미나이는 파이선(Python), 자바(JAVA), C++, Go 등 세계에서 널리 사용되는 프로그래밍 언어로 코드를 이해하고 생성할 수 있다. 

코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval) 벤치마크에서 제미나이 울트라는 74.4%를 기록해 GPT-4(67.0%)를 능가했다. 파이썬 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 벤치마크에서도 GPT-4 보다 1%포인트(p) 높은 74.9%를 기록했다. 

[사진= 구글 홈페이지]

wonjc6@newspim.com

 

[뉴스핌 베스트 기사]

사진
광복군, 일본군 무장해제 "항복사실 모르느냐? 변상문의 '화랑담배'는 6·25전쟁 이야기이다. 6·25전쟁 때 희생된 모든 분에게 감사드리고, 그 위대한 희생을 기리기 위해 제목을 '화랑담배'로 정했다. 우리는 그들에게 전의(戰意)가 없는 것을 보이기 위해 기관단총을 모두 어깨에 걸쳤다. 그러고도 만일을 위해서 각각 산개하면서 뛰어내리기 시작했다. 드디어 내 차례가 왔다. 몸을 날렸다. 아. 그때 그 바람 냄새, 그 공기의 열기, 아른대는 포플러의 아지랑이, 그리고는 아무것도 순간적이었지만 보이지 아니했다. 그러나 어쩐 일인가? 우리 주변엔 돌격 태세에 착검한 일본군이 포위하고 있었다. 워커 구두 밑의 여의도 모래가 발을 구르게 했다. 코끼리 콧대 같은 고무관을 제독총에 연결한 험상궂은 방독면을 뒤집어쓴 일본군이 차차 비행기를 중심으로 원거리 포위망을 좁혀오고 있었다. 너무나도 위험한 상황이었다. 이것이 그리던 조국 땅을 밟고 처음 맞은 분위기였다. 동지들은 눈빛을 무섭게 빛내면서 사주경계를 했다. 그러나 아직 기관단총을 거머쥐지는 아니했다. 여의도의 공기가 움직이지 않는 고체처럼 조여들어 왔다. 뿐만 아니었다. 타고 온 C46형 수송기로부터 한 50여m 떨어진 곳의 격납고 앞에는 실히 1개 중대나 되는 군인들이 일본도를 뽑아 든 한 장교에게 인솔되어 정렬해 있었다. 그 앞에는 고급장교인 듯한 자들이 한 줄 또 섰고, 장군 몇 명도 있는 듯했다. 그러나 무엇보다도 8월 18일 한낮의 그 뜨거운 여의도 열기가 우리를 더욱 긴장시켰다. 격납고 뒤에까지 무장한 군인이 대기하고 있었다. 중형전차의 기관포도 이쪽을 향하고 있었다. 환호하는 광복군. [사진= 국사편찬위원회] 비행장 아스팔트 위엔 한여름의 복사열이 그 위기의 긴장처럼 이글대고 있었다. 어느새 우리는 땀에 젖어 있었다. 기막힌 침묵이 십여 분이나 지났다. 그러나 그들은 어떤 행동도 취해 오지 않았다. 마침내 우리가 발걸음을 옮겼다. 우리는 일본군 고급 장교들이 늘어선 쪽으로 한걸음 씩 움직였다. 각자 산개, 조심하라! 누군가가 이렇게 나직하게 말했다. 서해 연안으로 비행기가 고도를 낮출 때 누군가가 유서를 쓰던 일이 이 순간 내 머릿속에서 상기되었다. 일본군 병사들은 우리가 다가서자 의외로 포위망을 풀 듯이 비켜섰다. 우리는 아직 기관단총을 어깨에 멘 그대로였다. 일본군이 길을 열어주자, 그들도 일본군 육군 중장을 선두로 한 장교단이 우리 쪽으로 오기 시작했다. 그가 바로 조선주차군사령관 죠오쯔끼(上月良夫)였다. 쬬오쯔기는 그의 참모장 이하라 소장과 나남 사단장과 참모들을 뒤로 거느렸다. 우리도 좌우로 벌려 섰다. 쬬오쯔기가 「나니시니 이라시따노?(무슨 일로 왔소?)」말문을 열었다. 퍽 야무지게 보였다. 우리는 말 대신 영등포 상공에서 뿌리다 남긴 선전 전단을 내밀어 주었다. 우리의 임무가 일본어와 우리말로 적힌 전단이었다. 거긴 또 우리가 이렇게 들어오게 된 사연도 적혀있었다. 우리는 한 장씩 그 전단을 다른 일본군 장교들에게 나누어 주었다. 쬬오쯔끼는 이를 받아 읽고, "일본은 정전만 한 상태이니 일단 돌아갔다가 휴전 조약이 체결된 다음에 재입국하라"라고 말했다. 그러면서 은근히 위협했다. 자기네 병사들이 꽤 흥분되어 있으니, 만약 돌아가지 않으면 그 신변 보호에 안전책임을 지기가 어렵다는 분위기라고 했다. 이에 이범석 장군이 "네 놈들의 천황이 이미 연합국에 무조건 항복한 사실을 모르느냐? 이제부터는 동경의 지시가 필요 없다는 것을 알아야 한다"라고 맞섰다. 그러나 쉽사리 양보하지 않았다. 옥신각신 말이 몇 번 건너 왔다 갔다. 갑자기 쬬오쯔끼는 한 일본군 대령에게 일을 처리하라고 지시했다. 그러면서 그는 동경서 손님이 오기로 되어 있어 마중을 나와 있던 참이란 말을 하고는 물러가 버렸다" 이범석 장군은 일본군 측에 "조선 총독을 만나 담판 짓겠다'라고 요구했으나 거절당했다. 일본군 무장해제 임무를 띠고 국내로 들어 온 '광복군 국내정진군'은 아무런 소득도 올리지 못한 채 다음 날 8월 19일 14:30분 여의도 기지를 이륙하여 중국으로 돌아갔다. 광복군은 미군정이 시작되고 나서 한참이나 지난 다음에 개인 자격으로 귀국할 수밖에 없었다. 조짐이 좋지 않았다. / 변상문 국방국악문화진흥회 이사장   2025-09-29 08:00
사진
손흥민 7·8호-부앙가 23호...환상 '흥부 듀오' [서울=뉴스핌] 박상욱 기자 = 손흥민이 시즌 7·8호골을 연달아 터뜨리며 4경기 연속골을 기록했다. 드니 부앙가도 시즌 23호골을 넣어 '흥부 듀오'는 3골을 합작하며 팀 승리에 결정적인 역할을 했다. LAFC 손흥민은 28일(한국시간) 미국 미주리주 세인트루이스의 에너자이저 파크에서 열린 2025 MLS 정규리그 서부 콘퍼런스 세인트루이스 시티SC와의 원정 경기에서 3-4-3 포메이션의 원톱 스트라이커로 선발 출전했다. LAFC는 '흥부 듀오'의 활약을 앞세워 3-0으로 완승을 거뒀다. LAFC는 승점 53을 기록하며 서부 콘퍼런스 4위 자리를 유지했다. [세인트루이스 로이터=뉴스핌] 박상욱 기자= 손흥민이 28일(한국시간) MLS 34라운드 세인트루이스 시티 SC와의 원정 경기에서 자신의 첫 번째 골을 넣고 '찰칵 세리머니'를 하고 있다. 2025.9.28 psoq1337@newspim.com [세인트루이스 로이터=뉴스핌] 박상욱 기자= 손흥민이 28일(한국시간) MLS 34라운드 세인트루이스와의 원정 경기에서 자신의 첫 번째 골을 넣고 골 셀레브레이션을 하고 있다. 2025.9.28 psoq1337@newspim.com 손흥민은 1-0으로 앞선 전반 추가시간 시즌 7호골을 뽑아냈다. 그는 중원에서 단독 드리블로 페널티박스 왼쪽까지 돌파한 뒤 오른발 슈팅으로 골망을 흔들며 선제골을 기록했다. 후반 15분에는 페널티박스 정면에서 수비수를 앞에 두고 오른발 슈팅으로 시즌 8호골을 추가, 이날 멀티골을 완성했다. 손흥민은 이번 시즌 MLS에서 8경기 만에 8골 3도움을 기록하며, 출전 경기마다 존재감을 과시하고 있다. MLS 기록 기준으로 이번 4경기 연속골은 지난 2021년 12월 토트넘 소속으로 EPL 14라운드부터 4경기 연속골을 기록한 이후 약 3년 9개월 만이다. 경기를 중계하던 현지 해설진은 "손흥민과 부앙가는 피할 수 없다(inevitable)"며 두 선수의 뜨거운 활약을 추켜세웠다. [세인트루이스 로이터=뉴스핌] 박상욱 기자= 손흥민이 28일(한국시간) MLS 34라운드 세인트루이스와의 원정 경기에서 자신의 두 번째 골을 넣고 골 셀레브레이션을 하고 있다. 2025.9.28 psoq1337@newspim.com [세인트루이스 로이터=뉴스핌] 박상욱 기자= 손흥민이 28일(한국시간) MLS 34라운드 세인트루이스 시티 SC와의 원정 경기에서 골을 넣고 부앙가과 손을 마주치고 있다. 2025.9.28 psoq1337@newspim.com 손흥민과 함께 공격을 이끄는 드니 부앙가(31)도 전반 15분 선제골을 터뜨리며 5경기 연속골로 시즌 23골을 기록, 리오넬 메시에 이어 득점 랭킹 2위에 올랏다. 두 선수는 최근 LAFC가 터트린 15골 중 절반 이상을 책임지고 있다. 경기 도중 손흥민과 부앙가는 높이 뛰어올라 하이파이브를 주고받는 세리머니를 펼치며 팀 분위기를 끌어올렸다. 세인트루이스에서는 정상빈이 왼쪽 날개 공격수로 선발 출전하며 '코리안 더비'가 성사됐다. 정상빈은 전반 2분 수비 뒷공간으로 빠르게 침투하다 LAFC 골키퍼와 충돌하며 경고를 받았지만 경기 내내 활발한 움직임을 보였다. 그는 후반 20분 공격포인트 없이 교체돼 벤치로 돌아갔다. 이날 승리로 LAFC의 스티브 체룬돌로 감독은 2022년 1월 지휘봉을 잡고 나서 통산 100승(36무 9패)째를 달성하는 기쁨을 맛봤다. psoq1337@newspim.com 2025-09-28 11:52
기사 번역
결과물 출력을 준비하고 있어요.
기사제목
기사가 번역된 내용입니다.
종목 추적기

S&P 500 기업 중 기사 내용이 영향을 줄 종목 추적

결과물 출력을 준비하고 있어요.

긍정 영향 종목

  • Lockheed Martin Corp. Industrials
    우크라이나 안보 지원 강화 기대감으로 방산 수요 증가 직접적. 미·러 긴장 완화 불확실성 속에서도 방위산업 매출 안정성 강화 예상됨.

부정 영향 종목

  • Caterpillar Inc. Industrials
    우크라이나 전쟁 장기화 시 건설 및 중장비 수요 불확실성 직접적. 글로벌 인프라 투자 지연으로 매출 성장 둔화 가능성 있음.
이 내용에 포함된 데이터와 의견은 뉴스핌 AI가 분석한 결과입니다. 정보 제공 목적으로만 작성되었으며, 특정 종목 매매를 권유하지 않습니다. 투자 판단 및 결과에 대한 책임은 투자자 본인에게 있습니다. 주식 투자는 원금 손실 가능성이 있으므로, 투자 전 충분한 조사와 전문가 상담을 권장합니다.
안다쇼핑
Top으로 이동