전체기사 최신뉴스 GAM 라씨로
KYD 디데이

구글, '제미나이' 생태계 구축해 AI 업계 최강 노린다

기사입력 : 2023년12월08일 14:50

최종수정 : 2023년12월08일 16:59

[서울=뉴스핌] 최원진 기자= 구글이 오픈AI의 최신 생성형 인공지능(AI) 거대언어모델(LLM) 'GPT-4'를 능가하는 자체 모델 '제미나이(Gemini) 1.0'을 6일(현지시간) 공개하면서 세상을 깜짝 놀라게 했다.

제미나이는 3가지 버전으로 나온다. 구글이 지금까지 내놓은 것 중 가장 강력한 LLM이자 데이터센터와 기업용 모델인 '울트라', 구글의 AI 챗봇 '바드'의 모델인 '프로', 스마트폰 등 모바일 기기에서 사용 가능한 컴팩트한 사이즈의 '나노'다.

구글 AI조직 딥마인드에 따르면 '제미나이 울트라'는 LLM 평가시 AI 업계에서 널리 사용되는 학술 벤치마크 기준 32개 가운데 30개 항목에서 GPT-4를 능가했다.

특히 제미나이 울트라는 대규모 다중작업 언어 이해(MMLU) 벤치마크에서 90% 이상의 정답률을 기록, GPT-4(87.29%) 보다 월등히 높았다.

MMLU는 수학, 물리학, 역사, 법률, 의학, 윤리 등 57개의 주제를 복합적으로 활용해 지식과 문제 해결 능력을 평가하는 대표 격 LLM 벤치마크다.

사실이라면 '제미나이 울트라'는 현존하는 가장 강력한 성능의 AI 모델이 된다. 오픈AI가 최신 GPT-4를 세상에 내놓은 지 약 9개월 만이다. 구글 제미나이가 AI 업계의 치열한 개발 경쟁에 다시 한번 불을 지피게 됐다. 제미나이의 등장은 단순한 기술 개발 경쟁을 떠나 업계의 판도를 뒤흔들 수 있다는 분석이 나온다.

[사진= 구글 홈페이지]

◆ 무료 배포된 '제미나이 바드'도 챗GPT 능가

구글은 제미나이를 공개한 6일 곧바로 챗봇 '바드'에 '제미나이 프로'를 탑재했다. 구글은 제미나이 울트라뿐만 아니라 프로도 'GPT-3.5' 구동의 챗GPT 보다 성능이 좋다고 주장한다.

시시 샤오 구글 어시스턴트 및 바드 부사장 겸 총괄은 "제미나이 프로가 8개 벤치마크 중 6개에서 GPT-3.5를 넘어섰다"고 밝혔다.

구체적으로 제미나이 프로의 MMLU 점수는 79.13%로 GPT-3.5(70%)보다 9.13% 높았고, 방대한 학교 수학 문제 데이터로 텍스트 이해도를 평가하는 GSM8K 벤치마크에서는 86.5%를 기록해 GPT-3.5 보다 무려 29.4%포인트(P) 높았다.

이 밖에 여러 단계의 추론을 요구하는 문제 해결 능력을 평가하는 빅 벤치 하드(BIG-Bench-Hard), 독해력 벤치마크인 DROP, 코딩 작업 성능을 평가하는 업계 표준인 휴먼이발(HumanEval), 파이선(Python) 코드 생성 능력을 평가하는 내추럴2코드(Natural2Code) 등 제미나이 프로는 여러모로 GPT-3.5를 앞섰다는 주장이다.

제미나이 프로의 높은 벤치마크 점수도 관심이지만 네티즌들의 관심은 제미나이의 '태생적 멀티모달(natively multi-modal)'에 있다. 오픈AI가 이미지 생성 AI '달리'(DALL-E), 음성 인식 AI '위스퍼'(Whisper)를 각각 개발한 방식과 달리 구글은 애초부터 텍스트·이미지·오디오·동영상 등 다양한 데이터로 제미나이를 훈련해 왔다.

구글은 제미나이 프로 구동의 바드에 점진적으로 이미지, 오디오, 동영상 프롬프트 기능을 추가할 예정이다. 현재는 텍스트, 이미지 프롬프트만 제공하고 있다.

구글이 완전한 멀티모달 바드를 내놓는다면 이는 세계에서 가장 널리 쓰이는 첫 멀티모달 챗봇이 될 전망이다.

기자가 8일 제미나이 프로 구동의 바드에 고양이 이미지와 함께 어떤 종류인지 질문하니 숏헤어종이란 답변을 받은 모습. [사진=바드]

◆ "물 들어올 때 노 젓는다" 구글, '제미나이 생태계' 구축에 박차

구글은 자사 AI 모델의 성능이 마이크로소프트(MS)와 협업하는 오픈AI의 모델보다 우수하다는 테스트 결과를 보고서로 적극적으로 홍보한 데 그치지 않고 곧바로 제품 탑재에 나섰다.

'제미나이 프로'를 바드에 결합한 데 이어 구글은 '제미나이 나노'를 자사 스마트폰 '픽셀 8 프로'에 접목했다. 제미나이 나노는 문자 작성 시 이용자가 원하는 답변 문장을 추천해 주는 '스마트 리플라이'(Smart Reply) 기능을 제공한다. 픽셀 8 프로에 있는 구글의 리코더(Recorder) 앱으로 장시간 회의나 강의를 녹음하면 제미나이가 주요 포인트를 요약해 준다.

구글은 앞으로도 제미나이를 자사 제품에 녹일 예정이다. 내년에 출시될 가장 강력한 '제미나이 울트라'는 기업용 제품이지만 그전에 '바드 어드벤스드'란 '챗GPT 플러스'와 같은 유료 버전 챗봇에 먼저 선보인다. 울트라는 멀티모달 검색을 넘어 이미지, 오디오, 동영상을 직접 생성해 줄 것으로 기대를 모은다.

구글은 향후 브라우저 '크롬'과 자사 앱들에도 AI 모델을 접목할 계획이다. 제미나이 생태계 구축을 통해 구글을 업계 선두주자로 발돋움하겠단 취지다.

주요 외신들은 GPT-4보다 뛰어난 제미나이 울트라가 일상에 실질적으로 도움을 줄 수 있는 생성형 AI에 가장 가까운 모델이며, 자사 소프트웨어와 클라우드 서비스에 오픈AI LLM을 채택해 온 구글의 경쟁사 마이크로소프트(MS)에 한방 먹였다고 진단한다.

무엇보다 제미나이가 구글 생태계 구축으로 우리 일상에 깊숙이 자리한다면 오픈AI의 업계 입지가 줄어드는 결과를 낳는다. 크롬은 전 세계 검색 시장에 60% 이상을 차지하고 있다. 이용자들이 크롬에서 제미나이 검색 경험에 익숙해질수록 챗GPT를 사용하기 위해 오픈AI 웹사이트에 접속할 일이 사라진다.

인도 뭄바이의 삼성 휴대폰 매장 [사진=로이터 뉴스핌]

구글 안드로이드 운영체제(OS)의 세계 시장 점유율은 70%다. 유튜브, G메일, 구글 독스(Docs), 구글 드라이브 등 앱까지 제미나이의 가능성은 그야말로 무궁무진하다.

제프리스는 최근 노트에서 "실질적으로 생성형 AI를 도입하고 있는 이들은 스타트업들과 MS, 구글, 아마존 등 하이퍼스케일러(hyperscaler·대형 클라우드 공급자)들 뿐"이라며 경쟁 상대가 많지 않아 구글이 제미나이로 시장 판도를 흔들 수 있다고 봤다.

최근 샘 올트먼 최고경영자(CEO) 축출 후 그의 복귀와 아직 완성되지 않은 이사진 개편 등 오픈AI가 혼란을 겪는 가운데 리스크 관리를 원하는 고객 기업들이 구글 제미나이로 재고할 수 있다는 관측도 나온다.

일각에서는 제미나이가 GPT 보다 조금 나은 수준이지 혁신적인 수준까진 아니고, 구글이 모델을 훈련한 데이터가 무엇이고, 어떻게 콘텐츠를 필터링했는지 등 정보를 제공하지 않았기에 자체 성능 테스트 결과를 믿지 못하겠단 의혹을 제기한다. AI 모델이 주어진 데이터 또는 맥락에 근거하지 않은 허위 정보를 생성하는 '할루시네이션'(Hallucination) 가능성도 구글이 앞으로 적극 들여다봐야 할 숙제다.

파이낸셜타임스(FT)는 "제미나이는 내년 구글에 큰 시장을 갖고 올 명확한 이점들이 있다"며 구글의 공격적 AI 사업 드라이브에 관해서는 "구글이 (오픈AI에) 뒤처질 의향이 없는 것으로 보인다"고 진단했다. 

 

wonjc6@newspim.com

[뉴스핌 베스트 기사]

사진
尹 지지율 2.3%p↓, 38.1%…"與 총선참패 '용산 책임론' 영향" [서울=뉴스핌] 박성준 기자 = 윤석열 대통령의 지지율이 소폭 하락해 30%대 후반을 기록했다는 여론조사 결과가 18일 발표됐다. 종합뉴스통신 뉴스핌 의뢰로 여론조사 전문업체 미디어리서치가 지난 15~16일 전국 만 18세 이상 남녀 1001명에게 물은 결과 윤 대통령의 국정운영에 대한 긍정평가는 38.1%로 집계됐다. 부정평가는 59.3%로 나타났다. '잘 모름'에 답한 비율은 2.5%다. 긍정평가와 부정평가 간 격차는 21.2%포인트(p)다. 긍정평가는 지난 조사 대비 2.3%p 하락했고, 부정평가는 1.6%p 상승했다. 연령별로 보면 40대에서 긍·부정 평가 격차가 극명하게 드러났다. 만 18세~29세에서 '잘함'은 36.0% '잘 못함' 61.0%였고, 30대에서는 '잘함' 30.0% '잘 못함' 65.5%였다. 40대는 '잘함' 23.9% '잘 못함' 74.2%, 50대는 '잘함' 38.1% '잘 못함' 59.8%로 집계됐다. 60대는 '잘함' 51.6% '잘 못함' 45.9%였고, 70대 이상에서는 60대와 같이 '잘함'이 50.4%로 '잘 못함'(48.2%)보다 높게 나타났다. 지역별로는 서울 '잘함' 38.5%, '잘 못함'은 60.1%로 집계됐다. 경기·인천 '잘함' 31.4% '잘 못함' 65.2%, 대전·충청·세종 '잘함' 32.7% '잘 못함' 63.4%, 부산·울산·경남 '잘함' 47.1% '잘 못함' 50.6%로 나타났다. 대구·경북은 '잘함' 58.5% '잘 못함' 38.0%, 전남·광주·전북 '잘함' 31.8% '잘 못함' 68.2%로 나타났다. 강원·제주는 '잘함' 37.1% '잘 못함' 60.5%로 집계됐다. 성별로도 남녀 모두 부정평가가 우세했다. 남성은 '잘함' 34.7% '잘 못함' 63.4%, 여성은 '잘함' 41.6% '잘 못함' 55.3%였다. 김대은 미디어리서치 대표는 윤 대통령 지지율 하락 배경에 대해 "108석에 그친 국민의힘의 총선 참패가 '윤 대통령의 일방적·독선적인 국정 운영 스타일로 일관한 탓이 크다'라는 '용산 책임론'이 대두되며 지지율이 하락했다"고 평가했다. 이준한 인천대 정치외교학과 교수도 "선거 결과에 대해 실망한 여론이 반영됐을 것"이라며 "최근 국무회의 발언 등을 국민들이 긍정적으로 생각하는 것도 아니고 경제 상황도 나아지고 있지 않아 추후 지지율은 더 낮아질 수 있다"고 분석했다. 이번 여론조사는 성·연령·지역별 인구비례 할당 추출 방식으로 추출된 표본을 구조화된 설문지를 이용한 무선(100%) ARS 전화조사 방식으로 실시했으며 응답률은 3.9%, 표본오차는 95% 신뢰수준에 ±3.1%p다. 통계보정은 2024년 1월말 행정안전부 주민등록 인구통계를 기준으로 성별 연령별 지역별 가중 값을 부여(셀가중)했다. 자세한 내용은 중앙선거여론조사심의위원회 홈페이지를 참조하면 된다. parksj@newspim.com 2024-04-18 06:00
사진
이재명 "다 접어두고 尹대통령 만나겠다" [서울=뉴스핌] 윤채영 김윤희 기자 = 이재명 더불어민주당 대표가 26일 윤석열 대통령과의 영수회담과 관련해 "의제도 정리하고 미리 사전조율도 해야하는데 그조차도 녹록지가 않은 것 같다"며 "다 접어두고 먼저 윤석열 대통령을 만나겠다"고 밝혔다. 이 대표는 이날 오전 국회에서 열린 최고위원회의에서 "복잡한 의제들이 미리 정리됐으면 좋았을 텐데 쉽지 않은 것 같다. 그거 정리하느라 시간 보내기 아쉽기 때문에 신속하게 만날 일정을 잡도록 하겠다"며 이같이 말했다. [서울=뉴스핌] 윤창빈 기자 = 이재명 더불어민주당 대표가 26일 오전 서울 여의도 국회에서 열린 최고위원회의에서 모두발언을 하고 있다. 2024.04.26 pangbin@newspim.com 이 대표는 "윤석열 대통령을 만나서 총선에서 드러난 우리 국민들의 민심을 가감없이 전달하도록 하겠다. 그리고 민생 현장의 참혹한 현실을 제대로 전달하고 또 필요한 조치들을 할 수 있도록 요청드리도록 하겠다"고 했다. 그는 이어 "윤석열 대통령께서도 우리 국민들의 이런 어려운 상황, 총선 민의를 잘 들어주시고 절박한 심정으로 어떻게하면 이 난국을 타개할 수 있을지 함께 고민해주시길 부탁드린다"고 촉구했다. 그러면서 "지금 이 위기를 벗어나지 못하면 몰락한다는 각오로 이번 회담에서 반드시 국민이 기대하는 성과, 가능한 조치들을 만들어내도록 노력하겠다"고 약속했다. 윤 대통령과 이 대표의 영수회담 실무회담은 전날에도 이어졌지만, 민주당은 "대통령실이 의제에 대해 구체적인 검토 결과를 제시하지 않았다"며 아쉬움을 표했다. 이에 대통령실은 "의제 제한을 두지 않고 사전 합의가 필요 없는 자유로운 형식의 회담을 가능한 빠른 시일 내에 개최하자"고 제안했다. 이 대표가 의제 조율이 지지부진하자 이를 접어두고 일단 윤 대통령을 만나겠다며 전향적인 입장을 밝힘에 따라 윤 대통령과 이 대표 간 만남은 금명간 성사될 것으로 전망된다.  ycy1486@newspim.com 2024-04-26 09:38
안다쇼핑
Top으로 이동