제미나이, '프로젝트 아스트라' 통해 실시간 AI 비서로 진화 중
'Flow·Joules·마리너'까지...구글, 분야별 AI 협업 도구 확장 가
[서울=뉴스핌] 양태훈 기자 = 구글이 차세대 멀티모달 AI '제미나이'와 이를 적용한 생성형 AI 제품군을 대거 공개했다. 실시간 상호작용이 가능한 AI 비서 '아스트라'부터 AI 기반 요약·협업 도구 '노트북LM', 창작·개발·소비자 업무를 자동화하는 실험적 툴까지, 인간의 창의성과 생산성을 증폭시키는 방향으로 AI 활용 전략을 제시했다.
2일 구글코리아는 서울 강남 조선 팰리스 호텔에서 '구글 포 코리아(Google for Korea) 2025' 기자간담회를 열고, 자사의 AI 전략과 한국 시장에서의 방향성을 공유했다.
마니쉬 굽타 구글 딥마인드 시니어 디렉터는 이날 행사에서 딥마인드가 개발한 '제미나이(Gemini)' 모델을 소개하며 "제미나이는 텍스트뿐 아니라 이미지, 오디오, 영상, 코드까지 이해하는 (진정한 의미의) 멀티모달 모델"이라며 "제미나이의 멀티모달 이해 능력을 통해 기존 AI보다 복잡하고 통합적인 현실의 문제를 해결할 수 있는 기반이 될 수 있다. AI는 더 이상 공상과학이 아니다"라고 강조했다.
마니쉬 굽타 시니어 디렉터는 대표적인 사례로, 구글 딥마인드가 개발 중인 '프로젝트 아스트라'를 소개했다. 이 프로젝트는 실시간 영상, 음성, 텍스트를 모두 이해하고, 사용자의 일상 속에서 자연스럽게 정보를 제공하거나 작업을 수행하는 멀티모달 AI 비서를 목표로 한다. 아스트라는 구글의 최신 거대언어모델(LLM)인 '제미나이 2.0'에 내장된 에이전트 프레임워크를 활용, 구글 검색 및 맵스, 렌즈 등 다양한 서비스와 연동된다.
마니쉬 굽타 시니어 디렉터는 "구글이 목표로 삼는 것은 단순히 정보를 주는 AI가 아니라, 인간의 상황과 맥락을 이해하고 적절하게 반응할 수 있는 동반자 같은 존재"라며 "아스트라는 학습과 창작, 의사결정 과정에서 사람들과 실시간으로 협업할 수 있는 AI 비서를 구현하는 데 중점을 두고 있다"고 설명했다.
![]() |
2일 서울 강남 조선 팰리스 호텔에서 열린 '구글 포 코리아(Google for Korea) 2025' 기자간담회 현장. 마니쉬 굽타 구글 딥마인드 시니어 디렉터가 발표하고 있다. [사진=양태훈 기자] |
마니쉬 굽타 디렉터는 ▲ 이미지 생성 AI 모델 'Imagen 4' ▲ 영상·오디오 생성 AI 모델 'VEO3' ▲ 음악 생성 AI 모델 'Lyria' 등 제미나이를 기반으로 한 다양한 제품도 소개했다. 그는 "이러한 생성형 AI 도구들은 예술가와의 협업을 전제로 설계됐으며, 단순히 콘텐츠를 만들어내는 것을 넘어 창작자의 상상력을 확장하고 새로운 표현 방식을 탐색할 수 있도록 돕는다"며 "Lyria의 경우, 뮤지션의 멜로디 아이디어를 기반으로 음악을 보완하거나 변형하는 방식으로 활용되고 있는데, 인도 뮤지션 샹카 마하데반과의 협업처럼 창작 현장에서 이미 활용되고 있다"고 전했다.
나아가 "최근 예술가, 디자이너, 콘텐츠 제작자들이 창작 활동에서 AI를 새로운 협업 파트너로 활용하고 있으며, 제미나이는 다양한 창작 과정을 지원하고 있다"며 "AI는 인간의 창의적 선택지를 넓히는 방향으로 나아가고 있다"고 덧붙였다.
구글은 AI 기술을 단순한 성능 향상이나 기술적 진보의 수단으로 보지 않고, 의료·교육·법률 등 사회적으로 민감한 영역에서 실질적인 문제 해결에 기여할 수 있는 도구로 삼는 데 초점을 맞추고 있다. 또한 영어 중심의 기술 편향을 극복하기 위해 한국어, 힌디어 등 다양한 언어에 대한 이해도를 높이고 있다.
마니쉬 굽타 디렉터는 "AI는 단순한 기술 진보가 아니라, 의료, 교육, 법률 등 민감한 분야에 실질적 도움을 줄 수 있는 방향으로 발전해야 한다"며 "사람들의 삶을 실질적으로 개선하는 도구가 되어야 한다"고 강조했다.
또 "딥마인드는 영어 외에도 수백 개 언어에 대한 이해도를 높이고 있으며, 특히 한국어와 힌디어 같은 언어에서 성능 격차를 줄이기 위한 작업을 진행 중"이라며 "단순한 번역을 넘어서 언어가 담고 있는 문화적 맥락까지 이해하도록 훈련시키고 있다. 예컨대 존댓말 사용, 나이와 관련한 사회적 관습 등은 단순 번역으로 해결되지 않기 때문에 이러한 특성도 모델이 반영할 수 있도록 벤치마크를 개발하고 커뮤니티와 공유하고 있다"고 설명했다.
![]() |
2일 서울 강남 조선 팰리스 호텔에서 열린 '구글 포 코리아(Google for Korea) 2025' 기자간담회 현장. 마니쉬 굽타 구글 딥마인드 시니어 디렉터가 발표하고 있다. [사진=양태훈 기자] |
마니쉬 굽타 디렉터는 구글의 AI 철학을 담은 대표적인 연구 성과로, 단백질 구조 예측 AI '알파폴드(AlphaFold)'를 소개했다. 알파폴드는 AI 기반의 단백질 3차원 구조 예측 시스템으로, 아미노산 서열만으로도 단백질의 입체 구조를 정확히 예측할 수 있다. 최근에는 단백질 간, 단백질- DNA, 단백질-RNA, 리간드 등 다양한 생체분자 간의 상호작용까지 예측할 수 있도록 발전했다.
그는 "과거에는 새로운 단백질 구조를 밝히는 데만 3~5년이 걸렸다"며 "알파폴드는 이 작업을 몇 초 만에 처리하고, 인류가 알고 있는 2억 개의 단백질 구조를 예측해 무료로 공개했다"고 말했다.
이어 "이 데이터는 암 치료, 신약 개발, 생분해성 플라스틱, 해충 저항성 식물 개발 등 다양한 분야에 활용되고 있다"며 "현재 알파폴드 데이터를 활용 중인 연구자만 6만 5,000명이 넘으며, 전체 과학자 수는 200만 명을 넘어선다"고 강조했다.
사이먼 토쿠미네 구글 랩스 디렉터는 '노트북 LM(Notebook LM)'과 '프로젝트 마리너(Project Marine)'의 최신 업데이트 내용을 공유했다. 구글 랩스는 구글의 혁신 기술을 실험적으로 제품화하는 조직으로, 신기술을 사용자 중심의 제품으로 전환하기 위한 다양한 실험을 수행한다. '배우기 위해 만든다(build to learn)'는 철학 아래, 4~5명 규모의 소규모 팀들이 각자의 가설을 바탕으로 수십 개의 프로젝트를 반복적으로 실험하며 실질적인 제품화 가능성을 탐색하고 있다.
사이먼 토쿠미네 디렉터는 구글 랩스가 지향하는 AI 제품 개발의 핵심 키워드로 '변환(transformation)'과 '협업(collaboration)'을 제시했다. 그는 "변환은 멀티모달 모델이 정보를 다른 형태로 바꾸는 능력이며, 협업은 AI가 인간과 함께 목표를 설정하고 의사결정을 돕는 능력"이라고 설명했다.
![]() |
2일 서울 강남 조선 팰리스 호텔에서 열린 '구글 포 코리아(Google for Korea) 2025' 기자간담회 현장. 사이먼 토쿠미네 구글 랩스 디렉터가 발표하고 있다. [사진=양태훈 기자] |
먼저 '변환'의 대표 사례로, 구글 랩스가 개발한 AI 기반 연구·노트 도구 '노트북 LM'을 소개했다. 이 도구는 사용자가 다양한 자료를 업로드하면 AI가 이를 분석·요약하고, 질문에 답하거나 새로운 콘텐츠를 생성해주는 서비스다.
사이먼 토쿠미네 디렉터는 "노트북 LM은 사용자가 10개, 20개 이상의 문서를 한꺼번에 업로드해도 그 안의 핵심 개념을 자동으로 정리하고, 주제별로 구조화된 마인드맵을 생성해준다"며 "이 마인드맵을 클릭하면 해당 주제에 대한 AI의 요약 설명이나 후속 질의응답이 가능해, 복잡한 정보를 직관적으로 탐색할 수 있다"고 설명했다.
이어 "노트북 LM은 단순한 텍스트 분석을 넘어, 콘텐츠를 자연어 기반 오디오로 변환하는 '오디오 오버뷰(Audio Overviews)' 기능과, 슬라이드 이미지에 AI 음성을 덧붙여 설명하는 '비디오 오버뷰(Video Overviews)' 기능도 제공한다"며 "이를 통해 운전 중이거나 손이 자유롭지 않은 상황에서도 주요 내용을 쉽게 파악할 수 있다"고 덧붙였다.
'오디오 오버뷰'는 문서의 핵심 내용을 두 명의 가상 화자가 자연스럽게 주고받는 대화 형식으로 구성해 음성 콘텐츠로 제공하는 기능이다. 한 명은 비전문가의 입장에서 질문하고, 다른 한 명은 전문가의 시각에서 설명해 사용자가 마치 팟캐스트를 듣듯 내용을 쉽게 이해할 수 있도록 돕는다.
'비디오 오버뷰'는 이미지, 텍스트, 도표 등을 자동으로 조합해 슬라이드 형태로 구성하고, 여기에 제미나이 기반 AI의 음성 내레이션을 더해 정보를 시각적·청각적으로 동시에 전달하는 기능이다. 사용자는 이를 통해 복잡한 문서의 흐름을 직관적으로 파악할 수 있으며, 교육, 보고, 프레젠테이션 등 다양한 목적으로 활용할 수 있다.
![]() |
2일 서울 강남 조선 팰리스 호텔에서 열린 '구글 포 코리아(Google for Korea) 2025' 기자간담회 현장. 사이먼 토쿠미네 구글 랩스 디렉터가 발표하고 있다. [사진=양태훈 기자] |
사이먼 토쿠미네 디렉터는 AI 기반 협업 도구의 대표 사례로 ▲영상 창작자를 위한 'Flow' ▲개발자를 위한 코드 자동 수정 도구 'Joules' ▲브라우저에서 반복 작업을 자동화하는 소비자용 툴 '프로젝트 마리너'를 소개했다.
'Flow'는 창작자가 원하는 스타일, 내러티브, 배경 등을 조합해 연출 방향을 직접 설정할 수 있는 비디오 제작 도구다. 'Joules'는 개발자가 제시한 버그 목록을 기반으로 코드를 자동 진단하고 수정하는 AI 에이전트이며, '프로젝트 마리너'는 레시피 재료 분석을 통한 장바구니 구성, 여행 예약 시 달력 확인 및 필터 적용 등 반복적인 웹 작업을 자동화해주는 서비스다.
사이먼 토쿠미네 디렉터는 "구글 랩스는 창작과 생산성 향상을 목표로, 일상 속 복잡한 정보 처리 과정을 단순화하는 AI 도구들을 실험적으로 개발하고 있다"며 "앞으로의 소프트웨어는 단순한 도구가 아닌 협력자로 진화할 것이며, 우리는 모두 AI와 협업하는 방법을 배워야 한다. 특히 기술 수용 속도가 빠른 한국에서 어떤 창의적인 방식으로 활용될지 매우 기대된다"고 강조했다.
dconnect@newspim.com