전체기사 최신뉴스 GAM 라씨로
KYD 디데이

오픈AI '챗GPT-4o' 기습공개..."사람처럼 보고 듣고 말해"

기사입력 : 2024년05월14일 06:09

최종수정 : 2024년05월14일 07:51

단일 모델로 음성, 텍스트, 시각 데이터를 처리
오픈AI "챗 GPT-4o, 기존보다 2배 빠르고 저렴"
구글 연례 최대 행사인 I/O 컨퍼런스 앞두고 기습 공개

[휴스턴=뉴스핌] 고인원 특파원= 챗GPT를 개발해 전 세계적인 생성형 인공지능(AI) 열풍을 몰고 온 오픈AI가 13일(현지시간) 챗GPT-4의 가장 최신 버전인 'GPT-4o'(GPT-포오)를 선보였다.

새롭게 공개된 GPT-4o는 주로 텍스트를 통해 대화할 수 있었던 기존 모델과 달리 텍스트뿐 아니라 청각, 시각을 이용해 추론하고 음성을 통해 마치 사람과 대화하듯 실시간 소통이 가능하다.

이날 시연에 나선 오픈AI의 마크 첸 멀티모달 연구책임자는 챗GPT-4o와 실시간으로 대화하고 소통하는 모습을 보여줬다. 

오픈AI가 13일 라이브스트림으로 공개한 챗GPT-4o 시연영상, 2024.05.14 koinwon@newspim.com

◆ 음성, 텍스트, 시각 데이터 처리..."기존보다 2배 빠르고 저렴"

첸 책임자가 "지금 시연 중이라 너무 긴장되는데 긴장을 풀도록 도와달라"고 하자 챗GPT-4o는 "숨을 크게 들이마시라"고 조언하고 "너는 최고의 전문가니까 괜찮아"라며 긴장을 달래주기도 했다. 

숨을 과도하게 들이마시는 모습을 보이자 "이봐 진공청소기가 아니잖아. 천천히 들이마셔야지"라며 농담을 하기도 했으며, 숨을 내쉬는 동안 "바로 그거야"라고 말하기도 했다. 마치 진짜 사람과 대화하는 것처럼 즉각적이고 자연스럽게 반응했다. 

로봇과 사랑에 대한 이야기를 들려달라고 하자 즉각 이야기를 시작했으며, "좀 더 감정적으로 말해줘"라거나 "로봇처럼 말해줘" 등 다양한 요구에 맞춰 마치 진짜 사람처럼 자연스럽게 어조나 목소리를 바꿨다.

이 외에도 수학 문제를 종이에 써서 보여주자 풀이 과정을 한 단계씩 자세히 설명해 주었으며, 코딩 과정을 보며 문제 해결을 도와주기도 했다. 

오픈AI의 최고기술책임자(CTO)인 미라 무라티는 블룸버그 뉴스와의 인터뷰에서 "이번에 처음으로 상호작용과 사용 편의성 면에서 큰 도약을 이뤘다"면서 "우리는 챗GPT와 같은 도구가 사람과 협업하는 것이 가능하게 만들고 있다"고 강조했다. 마치 사람과 함께 일하는 것처럼 챗GPT와 일할 수 있도록 하겠다는 것이다.

또 이날 공개된 챗GPT-4o는 한층 업그레이드된 통역 기능도 보여줬다. 첸이 이탈리아어만 가능한 사람과 소통할 수 있도록 도와달라고 하고 영어로 말하자 실시간으로 이를 이탈리아어로 통역해 주고, 상대의 이탈리아어는 다시 영어로 통역해 주며 실시간 통역사 역할도 했다.

다양한 입력을 처리하기 위해 서로 다른 AI 모델에 의존하는 지금까지의 여러 AI모델과 달리, GPT-4o는 음성, 텍스트, 시각을 단일 모델로 결합하여 이전 모델보다 훨씬 빠른 속도로 데이터를 처리한다. 오픈AI 측은 새로 공개된 4o가 기존 모델(터보)보다 2배 빠르고 훨씬 효율적이라고 밝혔다.

무라티 CTO는 "서로 다른 세 가지 모델(음성, 텍스트, 시각)이 함께 작동하면 반응 시간이 늦어지고 경험의 몰입도도 떨어진다"면서 "새로운 GPT-4o는 세 종류의 데이터를 하나의 모델로 처리하고 추론해 지연시간을 없애고 (사람과) 상호작용하는 것처럼 챗GPT와 상호작용을 할 수 있도록 해준다"고 설명했다.

하지만 이날 시연 과정에서 문제점도 포착됐다. 이날 시연 중 오디오가 끊기는 현상이 발생했으며, 수학 문제 풀이를 마친 후 갑자기 "옷이 멋지네요"라며 다소 상황과 맞지 않는 엉뚱한 발언을 하기도 했다. 

챗GPT와 오픈AI 일러스트 이미지. [사진=로이터 뉴스핌]

◆ 구글 연례 최대 행사인 I/O 컨퍼런스 앞두고 기습 공개 

오픈AI는 이번 업데이트를 통해 웹에서 검색하여 질문에 대한 답변 찾기, 챗봇과 대화하여 다양한 음성으로 답변 듣기, 챗봇이 향후 기억할 수 있는 정보를 저장하도록 명령하는 기능 등 지금까지 유료 사용자에게만 제공됐던 여러 기능을 무료 사용자들에게도 제공할 것이라고 밝혔다. 업데이트된 버전은 향후 몇 주 내에 대중에 공개될 예정이다. 

이날 새롭게 공개된 GPT-4o는 빠르게 진화하는 AI시장에 다시 한번 지각 변동을 일으킬 전망이다. 구글, 코히어, 앤드로픽 등 여러 스타트업과 빅테크 기업들은 챗GPT-4를 업계 표준 삼아 성능이 비슷하거나 더 뛰어난 AI 모델 출시에 박차를 가하고 있다. 

특히 이날 GPT-4o 공개는 구글 연례 최대 행사인 I/O 컨퍼런스 직전에 기습적으로 이뤄진 것이어서 더욱 눈길을 끈다. 오픈AI에 비해 상대적으로 뒤쳐졌다는 평가 속에 구글은 하루 뒤인 14일 개최될 I/O 콘퍼런스에서 생성 AI인 제미나이를 비롯해 안드로이드, 검색, 크롬 브라우저 등 구글 서비스 전반에 대한 최신 사항을 발표할 것으로 기대된다. 

koinwon@newspim.com

[뉴스핌 베스트 기사]

사진
'취중진담' 전람회 출신 서동욱 사망…향년 50세 [서울=뉴스핌] 김연순 기자 = 1990년대 인기 듀오 '전람회' 출신인 서동욱 모건스탠리 프라이빗 에쿼티 부대표가 18일 지병으로 세상을 떠났다. 향년 50세. 서동욱은 휘문고와 연세대 동창인 싱어송라이터 김동률과 전람회를 결성해 1993년 MBC 대학가요제에서 '꿈속에서'로 대상을 받으며 등장했다. 서동욱 모건스탠리 프라이빗 에쿼티 부대표 [사진=모건스탠리 홈페이지] 전람회는 1994년 1집으로 정식 데뷔한 이후 1997년 해체할 때까지 세 장의 앨범을 냈다. 서동욱은 김동률과 전람회로 기억의 습작, 취중진담, 졸업 등의 히트곡을 냈다. 고인의 빈소는 서울 연세대 신촌 세브란스병원 장례식장 특실 1호에 마련됐고, 발인은 20일 오전 11시 40분, 장지는 서울시립승화원이다. y2kid@newspim.com 2024-12-18 21:50
사진
달러/원 환율 1,450원 돌파...15년래 최고 [서울=뉴스핌] 고인원 기자= 19일 달러/원 환율이 1450원도 돌파하며 15년 6개월 만에 최고치를 기록했다. 올해 마지막 연방공개시장위원회(FOMC) 정례 회의에서 미국 연방준비제도(Fed)가 예상대로 기준 금리를 0.25%포인트 인하했으나 내년 기준 금리 인하 속도를 줄일 가능성을 시사한 여파다. 연준은 18일(현지 시각) 이틀간 연방공개시장위원회(FOMC) 정례 회의를 마치고 기준 금리를 4.25~4.50%로 0.25%포인트(%p) 인하한다고 밝혔다. 이로써 연준은 9월과 11월에 이어 이달까지 세 번의 회의에서 연속으로 기준 금리를 내렸다. 연준은 별도로 공개한 경제 전망 요약(SEP)에서 내년 말까지 금리 인하 폭을 0.50%p로 제시했다. 이는 9월 1.00%p를 기대한 것에서 크게 축소된 수치다. 이 같은 예상대로면 연준은 내년 0.25%p씩 총 두 차례 금리를 낮추게 된다. 매파적인 연준의 내년 금리 전망에 이날 미 달러화는 2년 만에 최고 수준으로 올라섰고, 달러/원 환율은 한국 시간 19일 오전 6시 50분 기준 1453원으로 1450원도 넘어섰다. 이는 지난 2009년 3월 이후 약 15년 만에 최고치다. 지난 2017년 도널드 트럼프 당시 대통령이 제롬 파월 당시 연방준비제도(Fed) 이사를 차기 의장으로 지명했다. [사진=블룸버그] koinwon@newspim.com 2024-12-19 06:58
안다쇼핑
Top으로 이동