"AI는 더 이상 공상과학 아냐"…구글, 제미나이 적용 사례 소개

기사입력 : 2025년07월02일 14:27

최종수정 : 2025년07월02일 14:27

제미나이, '프로젝트 아스트라' 통해 실시간 AI 비서로 진화 중
'Flow·Joules·마리너'까지...구글, 분야별 AI 협업 도구 확장 가

[서울=뉴스핌] 양태훈 기자 = 구글이 차세대 멀티모달 AI '제미나이'와 이를 적용한 생성형 AI 제품군을 대거 공개했다. 실시간 상호작용이 가능한 AI 비서 '아스트라'부터 AI 기반 요약·협업 도구 '노트북LM', 창작·개발·소비자 업무를 자동화하는 실험적 툴까지, 인간의 창의성과 생산성을 증폭시키는 방향으로 AI 활용 전략을 제시했다.

2일 구글코리아는 서울 강남 조선 팰리스 호텔에서 '구글 포 코리아(Google for Korea) 2025' 기자간담회를 열고, 자사의 AI 전략과 한국 시장에서의 방향성을 공유했다.

마니쉬 굽타 구글 딥마인드 시니어 디렉터는 이날 행사에서 딥마인드가 개발한 '제미나이(Gemini)' 모델을 소개하며 "제미나이는 텍스트뿐 아니라 이미지, 오디오, 영상, 코드까지 이해하는 (진정한 의미의) 멀티모달 모델"이라며 "제미나이의 멀티모달 이해 능력을 통해 기존 AI보다 복잡하고 통합적인 현실의 문제를 해결할 수 있는 기반이 될 수 있다. AI는 더 이상 공상과학이 아니다"라고 강조했다.

마니쉬 굽타 시니어 디렉터는 대표적인 사례로, 구글 딥마인드가 개발 중인 '프로젝트 아스트라'를 소개했다. 이 프로젝트는 실시간 영상, 음성, 텍스트를 모두 이해하고, 사용자의 일상 속에서 자연스럽게 정보를 제공하거나 작업을 수행하는 멀티모달 AI 비서를 목표로 한다. 아스트라는 구글의 최신 거대언어모델(LLM)인 '제미나이 2.0'에 내장된 에이전트 프레임워크를 활용, 구글 검색 및 맵스, 렌즈 등 다양한 서비스와 연동된다.

마니쉬 굽타 시니어 디렉터는 "구글이 목표로 삼는 것은 단순히 정보를 주는 AI가 아니라, 인간의 상황과 맥락을 이해하고 적절하게 반응할 수 있는 동반자 같은 존재"라며 "아스트라는 학습과 창작, 의사결정 과정에서 사람들과 실시간으로 협업할 수 있는 AI 비서를 구현하는 데 중점을 두고 있다"고 설명했다.

2일 서울 강남 조선 팰리스 호텔에서 열린 '구글 포 코리아(Google for Korea) 2025' 기자간담회 현장. 마니쉬 굽타 구글 딥마인드 시니어 디렉터가 발표하고 있다. [사진=양태훈 기자]

마니쉬 굽타 디렉터는 ▲ 이미지 생성 AI 모델 'Imagen 4' ▲ 영상·오디오 생성 AI 모델 'VEO3' ▲ 음악 생성 AI 모델 'Lyria' 등 제미나이를 기반으로 한 다양한 제품도 소개했다. 그는 "이러한 생성형 AI 도구들은 예술가와의 협업을 전제로 설계됐으며, 단순히 콘텐츠를 만들어내는 것을 넘어 창작자의 상상력을 확장하고 새로운 표현 방식을 탐색할 수 있도록 돕는다"며 "Lyria의 경우, 뮤지션의 멜로디 아이디어를 기반으로 음악을 보완하거나 변형하는 방식으로 활용되고 있는데, 인도 뮤지션 샹카 마하데반과의 협업처럼 창작 현장에서 이미 활용되고 있다"고 전했다.

나아가 "최근 예술가, 디자이너, 콘텐츠 제작자들이 창작 활동에서 AI를 새로운 협업 파트너로 활용하고 있으며, 제미나이는 다양한 창작 과정을 지원하고 있다"며 "AI는 인간의 창의적 선택지를 넓히는 방향으로 나아가고 있다"고 덧붙였다.

구글은 AI 기술을 단순한 성능 향상이나 기술적 진보의 수단으로 보지 않고, 의료·교육·법률 등 사회적으로 민감한 영역에서 실질적인 문제 해결에 기여할 수 있는 도구로 삼는 데 초점을 맞추고 있다. 또한 영어 중심의 기술 편향을 극복하기 위해 한국어, 힌디어 등 다양한 언어에 대한 이해도를 높이고 있다.

마니쉬 굽타 디렉터는 "AI는 단순한 기술 진보가 아니라, 의료, 교육, 법률 등 민감한 분야에 실질적 도움을 줄 수 있는 방향으로 발전해야 한다"며 "사람들의 삶을 실질적으로 개선하는 도구가 되어야 한다"고 강조했다.

또 "딥마인드는 영어 외에도 수백 개 언어에 대한 이해도를 높이고 있으며, 특히 한국어와 힌디어 같은 언어에서 성능 격차를 줄이기 위한 작업을 진행 중"이라며 "단순한 번역을 넘어서 언어가 담고 있는 문화적 맥락까지 이해하도록 훈련시키고 있다. 예컨대 존댓말 사용, 나이와 관련한 사회적 관습 등은 단순 번역으로 해결되지 않기 때문에 이러한 특성도 모델이 반영할 수 있도록 벤치마크를 개발하고 커뮤니티와 공유하고 있다"고 설명했다.

마니쉬 굽타 디렉터는 구글의 AI 철학을 담은 대표적인 연구 성과로, 단백질 구조 예측 AI '알파폴드(AlphaFold)'를 소개했다. 알파폴드는 AI 기반의 단백질 3차원 구조 예측 시스템으로, 아미노산 서열만으로도 단백질의 입체 구조를 정확히 예측할 수 있다. 최근에는 단백질 간, 단백질- DNA, 단백질-RNA, 리간드 등 다양한 생체분자 간의 상호작용까지 예측할 수 있도록 발전했다.

그는 "과거에는 새로운 단백질 구조를 밝히는 데만 3~5년이 걸렸다"며 "알파폴드는 이 작업을 몇 초 만에 처리하고, 인류가 알고 있는 2억 개의 단백질 구조를 예측해 무료로 공개했다"고 말했다.

이어 "이 데이터는 암 치료, 신약 개발, 생분해성 플라스틱, 해충 저항성 식물 개발 등 다양한 분야에 활용되고 있다"며 "현재 알파폴드 데이터를 활용 중인 연구자만 6만 5,000명이 넘으며, 전체 과학자 수는 200만 명을 넘어선다"고 강조했다.

사이먼 토쿠미네 구글 랩스 디렉터는 '노트북 LM(Notebook LM)'과 '프로젝트 마리너(Project Marine)'의 최신 업데이트 내용을 공유했다. 구글 랩스는 구글의 혁신 기술을 실험적으로 제품화하는 조직으로, 신기술을 사용자 중심의 제품으로 전환하기 위한 다양한 실험을 수행한다. '배우기 위해 만든다(build to learn)'는 철학 아래, 4~5명 규모의 소규모 팀들이 각자의 가설을 바탕으로 수십 개의 프로젝트를 반복적으로 실험하며 실질적인 제품화 가능성을 탐색하고 있다.

사이먼 토쿠미네 디렉터는 구글 랩스가 지향하는 AI 제품 개발의 핵심 키워드로 '변환(transformation)'과 '협업(collaboration)'을 제시했다. 그는 "변환은 멀티모달 모델이 정보를 다른 형태로 바꾸는 능력이며, 협업은 AI가 인간과 함께 목표를 설정하고 의사결정을 돕는 능력"이라고 설명했다.

2일 서울 강남 조선 팰리스 호텔에서 열린 '구글 포 코리아(Google for Korea) 2025' 기자간담회 현장. 사이먼 토쿠미네 구글 랩스 디렉터가 발표하고 있다. [사진=양태훈 기자]

먼저 '변환'의 대표 사례로, 구글 랩스가 개발한 AI 기반 연구·노트 도구 '노트북 LM'을 소개했다. 이 도구는 사용자가 다양한 자료를 업로드하면 AI가 이를 분석·요약하고, 질문에 답하거나 새로운 콘텐츠를 생성해주는 서비스다.

사이먼 토쿠미네 디렉터는 "노트북 LM은 사용자가 10개, 20개 이상의 문서를 한꺼번에 업로드해도 그 안의 핵심 개념을 자동으로 정리하고, 주제별로 구조화된 마인드맵을 생성해준다"며 "이 마인드맵을 클릭하면 해당 주제에 대한 AI의 요약 설명이나 후속 질의응답이 가능해, 복잡한 정보를 직관적으로 탐색할 수 있다"고 설명했다.

이어 "노트북 LM은 단순한 텍스트 분석을 넘어, 콘텐츠를 자연어 기반 오디오로 변환하는 '오디오 오버뷰(Audio Overviews)' 기능과, 슬라이드 이미지에 AI 음성을 덧붙여 설명하는 '비디오 오버뷰(Video Overviews)' 기능도 제공한다"며 "이를 통해 운전 중이거나 손이 자유롭지 않은 상황에서도 주요 내용을 쉽게 파악할 수 있다"고 덧붙였다.

'오디오 오버뷰'는 문서의 핵심 내용을 두 명의 가상 화자가 자연스럽게 주고받는 대화 형식으로 구성해 음성 콘텐츠로 제공하는 기능이다. 한 명은 비전문가의 입장에서 질문하고, 다른 한 명은 전문가의 시각에서 설명해 사용자가 마치 팟캐스트를 듣듯 내용을 쉽게 이해할 수 있도록 돕는다.

'비디오 오버뷰'는 이미지, 텍스트, 도표 등을 자동으로 조합해 슬라이드 형태로 구성하고, 여기에 제미나이 기반 AI의 음성 내레이션을 더해 정보를 시각적·청각적으로 동시에 전달하는 기능이다. 사용자는 이를 통해 복잡한 문서의 흐름을 직관적으로 파악할 수 있으며, 교육, 보고, 프레젠테이션 등 다양한 목적으로 활용할 수 있다.

사이먼 토쿠미네 디렉터는 AI 기반 협업 도구의 대표 사례로 ▲영상 창작자를 위한 'Flow' ▲개발자를 위한 코드 자동 수정 도구 'Joules' ▲브라우저에서 반복 작업을 자동화하는 소비자용 툴 '프로젝트 마리너'를 소개했다.

'Flow'는 창작자가 원하는 스타일, 내러티브, 배경 등을 조합해 연출 방향을 직접 설정할 수 있는 비디오 제작 도구다. 'Joules'는 개발자가 제시한 버그 목록을 기반으로 코드를 자동 진단하고 수정하는 AI 에이전트이며, '프로젝트 마리너'는 레시피 재료 분석을 통한 장바구니 구성, 여행 예약 시 달력 확인 및 필터 적용 등 반복적인 웹 작업을 자동화해주는 서비스다.

사이먼 토쿠미네 디렉터는 "구글 랩스는 창작과 생산성 향상을 목표로, 일상 속 복잡한 정보 처리 과정을 단순화하는 AI 도구들을 실험적으로 개발하고 있다"며 "앞으로의 소프트웨어는 단순한 도구가 아닌 협력자로 진화할 것이며, 우리는 모두 AI와 협업하는 방법을 배워야 한다. 특히 기술 수용 속도가 빠른 한국에서 어떤 창의적인 방식으로 활용될지 매우 기대된다"고 강조했다.

dconnect@newspim.com

사진

뉴스핌, AI 기반 맞춤형 MY뉴스 출시 [세종=뉴스핌] 이경태 기자 = 매일 쏟아지는 수만 개의 뉴스 중에서 정작 나에게 필요한 뉴스를 찾기는 쉽지 않다. 이런 고민을 해결하기 위해 종합뉴스통신사 뉴스핌이 국내 최초로 AI(인공지능)로 독자에게 뉴스를 추천해주는 'AI MY뉴스'를 11일 본격 출시했다. AI MY뉴스의 핵심은 지능형 구조에 있다. 그동안 미디어는 독자가 선택한 관심 분야에 의존해 단순히 뉴스를 선별해 제공했다. 그러나 AI MY뉴스는 독자를 이해하고 학습해가며 개인에게 꼭 필요한 뉴스를 골라 제공한다. ◆ AI 추천뉴스·글로벌투자·AI 어시스턴트 출시 'AI 추천뉴스'는 독자가 첫 번째 기사를 클릭하는 순간부터 작동한다. 관심 카테고리를 선택하고 기사를 읽을 때마다 AI 시스템이 독자의 취향을 기억하고 분석한다. 경제 뉴스를 자주 읽는 독자라면 점차 반도체, 주식, 부동산 등 세부 관심사까지 파악해 더욱 정확한 뉴스를 추천한다. '모닝 브리핑'과 '런치 브리핑'은 바쁜 현대인을 위한 맞춤 서비스다. 모닝 브리핑은 AI가 밤새 분석한 전날과 당일 새벽까지의 주요 뉴스를 5~7개 헤드라인으로 정리해 제공한다. 런치 브리핑은 오전 7시부터 정오까지의 뉴스를 공공·정치, 산업시장, 글로벌, 전국 이슈 등 4개 분야로 나눠 각각 5개씩 핵심 내용을 전달한다. '글로벌 투자' 서비스는 AI MY뉴스의 핵심 콘텐츠다. 뉴스핌 마켓 전문기자들의 고품질 투자분석 'GAM(Global Asset Management)'을 독자에게 제공한다. '글로벌 브리핑'은 미국 증권시장 상황을 한눈에 파악할 수 있도록 날마다 시장 개요부터 투자자 관점까지 4개 섹션으로 체계화된 분석을 제공한다. 애플, 마이크로소프트, 엔비디아 등 주요 기술주를 별도 추적해 대형 기술주의 시장 영향력을 정밀 분석한다. '파워 특징주 포트폴리오'는 일일 수익률, 변동성, 이동평균 편차 등 핵심 지표를 종합해 수익률 상위 종목을 분석하고, '이 시각 증시 시그널'은 글로벌 이슈를 실시간으로 찾아 미국 증시에 영향을 줄 수 있는 신호로 정리해 제공한다. '주간 연준 인사이트'는 연방준비위원회 공식 브리핑을 투자자 관점에서 재해석하며, '뉴욕증시 전문가 팁'은 매일 뉴욕 현지 증시 전문가들의 생생한 조언을 5개의 구체적인 팁으로 가공해 전달한다. 이 가운데 '뉴스 종목 추적기'는 전 세계 글로벌 뉴스에서 미국 시장에 영향을 줄 수 있는 요인을 실시간으로 포착한다. S&P500 전체 기업을 대상으로 긍정적·부정적 영향을 받을 종목을 각각 5개씩 찾아 구체적인 이유도 내놓는다. 뉴스핌이 새롭게 내놓는 AI MY뉴스 서비스 모습 [자료=뉴스핌DB] 2025.08.08 biggerthanseoul@newspim.com 뉴스핌은 글로벌 AI 검색 기업 퍼플렉시티와 협력해 생활 밀착형 AI 어시스턴트도 제공한다. '뉴스 전략 24시'는 그동안 축적된 뉴스 데이터를 바탕으로 독자의 질문 의도를 파악해 맞춤형 답변과 생활 전략을 제시한다. 미국 증시 투자 전략도 함께 제공해준다. '정책 배달 119'는 정부 정책브리핑의 모든 데이터를 기반으로 개인 상황에 맞는 정책을 찾아 신청 방법까지 안내하는 개인 맞춤형 정책 컨설턴트 역할을 한다. 단순 검색에서 그치지 않고 독자의 행동을 이끌 수 있는 현실적인 답변을 제시한다. 뉴스핌의 모든 기사는 50개 국어로 번역돼 국내 거주 외국인과 해외 독자들도 모국어로 한국 뉴스를 접할 수 있다. ◆ "독자와 함께 성장하는 새로운 미디어 경험의 시작" 민병복 뉴스핌 회장은 "AI MY뉴스는 정보 홍수 시대에 진정으로 필요한 뉴스를 선별해 전달하는 새로운 미디어 패러다임을 제시한다"며 "경제적 어려움 속에서도 국민 모두의 삶에 힘이 되는 뉴스를 제공하겠다"고 강조했다. 민 회장은 "AI MY뉴스는 독자와 함께 성장하며 개인의 삶에 진정한 가치를 더하는 새로운 미디어 경험의 시작"이라며 "AI를 활용해 새로운 결과를 도출하는 것은 쉬운 일이 아니기 때문에 직접 AI로 콘텐츠를 만들어 국민 모두가 제한 없이 무료 서비스를 바로 활용할 수 있게 했다"고 말했다. 이번 AI MY뉴스 서비스는 첫 버전(V 1.0)이다. 우선 모바일 웹페이지에서 서비스가 제공된다. 뉴스핌은 국민을 대상으로 맞춤형 콘텐츠 수요를 직접 파악해 국민이 원하는 서비스를 지속 개발해나갈 예정이다. 분야별 독자들의 성향을 파악해 다양한 콘텐츠 설계 아이디어를 받아 매월 지속적인 콘텐츠 업데이트에 나설 예정이다. 이어 이미 서비스에 나선 AI 아나운서 글로벌 투자 콘텐츠는 물론, 다양한 영상 콘텐츠도 선보일 계획이다. 이를 토대로 뉴스핌은 국내를 뛰어넘어 세계 시장에서 AI를 잘 활용하는 글로벌 뉴스통신사로 도약하는 데 속도를 낼 예정이다. biggerthanseoul@newspim.com 2025-08-11 12:54