바드, 매개변수 5400억개 팜2로 교체해 성능 향상
한국어·프로그래밍 언어 지원, 이미지·코딩 결합
[실리콘밸리=뉴스핌] 김나래 특파원 = "검색의 새로운 시대 열었다"
월스트리트저널(WSJ)은 구글(GOOG)이 신무기로 내놓은 업그레이된 인공지능(AI) 바드에 대해 이렇게 평가했다. 구글은 최근 마이크로소프트(MS)가 AI 시장 선점에 나서자 '연례 개발자 회의(I/O)'에서 기존보다 더 강력해진 바드를 공개하며 반격에 나서며 호평을 받고 있다.
이처럼 '바드가 챗GPT를 따라 잡았다'는 평가를 받을 수 있었던 이유는 구글이 공개한 초거대AI 언어모델(LLM)인 팜2(PaLM) 덕분이다. 대부분 기존 서비스에 AI 기능을 더해 다양한 제품들을 선보이거나 팜2를 새로운 AI기능에 대폭 접목시켰다.
[바드가 궁금해] 글싣는 순서
1. '전격해부' 바드, A to Z 사용 설명서
2. 바드가 언어마다 다른 답을 내놓는 이유는
3. 바드와 챗GPT·빙 뭐가 더 나을까
4. '20년 검색 원조 맛집' 구글, SGE·제니마이로 판도 바꾼다
[뉴스핌=김나래 기자] 2023.05.16 ticktock0326@newspim.com |
◆강력해진 바드가 달라진 이유는 '팜2'
바드의 LLM을 람다(LaMDA)에서 팜2로 교체한 것은 신의 한수였다. 지난 2월 공개한 람다는 인간 두뇌의 시냅스에 해당하는 파라미터 수(매개변수)가 1370억개였지만 팜2는 5400억개이며, 100개 언어를 학습했다.
초거대AI는 인간 두뇌의 시냅스에 해당하는 매개변수가 10억개 이상인 인공지능을 뜻한다. 파라미터가 클수록 연산 능력이 뛰어난 것이 특징이고 이를 다양하게 응용할 수 있다.
구글이 발표하기 전 가장 많은 매개변수를 자랑하던 엔비디아는 5300억개, 오픈AI의 GPT-3.5를 적용한 챗GPT는 파라미터수 1750억개다. 메타의 라마는 650억개 정도다. 팜2의 매개변수는 무려 GPT-3.5의 3배이며 엔비디아보다도 많다.
문제는 파라미터수가 크면 서버 비용 부담이 커지게 되는데 구글은 이를 타개할 해법을 제시했다. 이에 구글은 팜2를 용도에 따라 맞춤형으로 제공할 방침이다. 게코(도마뱀), 오터(해달), 바이슨(들소), 유니콘 등 4가지로 나눴다. 이는 팜2를 기반으로 한 다양한 LLM을 쪼개 AI 시장을 장악하겠다는 뜻으로 해석된다.
[뉴스핌=김나래 기자] 바드와 팜이 결합된 사례 [사진=구글 홈페이지] 2023.05.16 ticktock0326@newspim.com |
◆ 주목해야 할 바드의 관전 포인트는?
구글이 내놓은 바드의 가장 큰 특징은 팜2 기반의 다국어 기능이다. 지난 3월 미국과 영국에서 출시한 AI챗봇 바드도 성능을 대폭 강화해, 현재 180여국에 전면 공개했다. 이전까지는 대기·승인 시스템을 거쳤지만 이날부터는 누구든 바로 사용할 수 있게됐다.
또 바드에 영어 외에 두번 째 언어로 한국어와 일본어를 적용한 것이 특징이다. 구글 측은 조만간 40개의 언어로도 서비스가 지원될 예정이라 밝혔다. 또한 AI 챗봇은 이전 버전보다 시, 속담, 수수께끼와 같은 미묘한 형태의 언어를 이해할 수 있다.
바드의 답변이 이미지와 결합된 것도 특징이다. 이용자의 질문에 이미지를 답으로 내놓고, 또 이미지에 대한 질문도 해결할 수 있다. 바드가 시각 분석을 사용해 정보를 가져오도록 '구글 렌즈'를 결합했다. 예컨대 관광장소에 대해 물으면 바드가 답변과 함께 관련 장소 이미지도 함께 보여준다.
바드의 시장을 확장하기 위해 타사와도 손을 잡았다는 점도 눈에 띈다. 구글은 어도비의 생성형 AI 모델 '파이어플라이'와 결합해 고품질의 이미지로 답변하고 이미지를 편집할 수 있는 기능을 추가하기로 했다. 이를 통해 저작권 문제 논란도 해결할 수 있는 방법을 제시했다는 평가를 받았다. 또 바드는 어도비 외에도 스포티파이, 칸 아카데미, 우버 이츠 등 타사 브랜드와 연결시켜 시장을 확대해 나간다는 복안이다.
대대적으로 업데이트된 코딩 기능도 주목받고 있다. 특히 이번에 순다르 피차이 구글 최고경영자(CEO)가 한국어로 코딩을 생성하는 기술을 시연했다. 구글은 바드 베타 버전 테스트 과정에서 이용자들이 가장 많이 활용했던 기능이 코딩이라는 점을 감안해 이를 향상시켰다고 털어놨다. MS의 깃허브는 확장 기능의 하나로 코드 작성이 가능하다면 구글의 경우 코드 작성부터 보안, 취약성 점검과 디버깅 등 코딩 등 모든 코딩 제공이 가능하다는 점이 특징이다.
이외에도 바드는 C++, 자바스크립트, R, 파이썬 등 20여개 이상의 프로그래밍 언어도 지원한다. 프로그래밍 언어를 모르는 이용자도 바드를 이용하면 프로그램을 쉽게 만들 수 있다.
[뉴스핌=김나래 기자] SGE가 결합된 새로운 AI검색의 예시 [사진=구글 홈페이지] 2023.05.16 ticktock0326@newspim.com |
◆ 팜2 적용된 '뉴 AI기능' 대거 제공
구글은 바드외에도 팜2를 새로운 기능으로 확장시켰다. 메드팜2가 대표적이다. 메드팜2를 활용하면 엑스레이 사진에서 어느 부분이 문제인지 분석해줄 수 있고 영상에서 정보를 합성하고 방사선 전문의가 영상을 해석하고 결과를 전달할 수 있다. 이 버전은 저널, 교과서, 임상 노트 및 환자 기록을 포함한 방대한 의학 텍스트로 훈련된다.
구글에 따르면 메드팜2는 85%의 정확도를 보였으며 의사나 전문가 수준으로 건강 검진 문제에 대한 답변을 제공할 수 있다.
구글 검색에도 팜2가 적용된다. 새롭게 선보인 구글 AI 검색은 생성형 검색 경험(Search Generative Experience·SGE)이다. SGE는 특정 물품을 추천 시 구매 할 때 고려해야 할 요소와 예산에 적합한 상품을 검색을 통해 추천해주고 이를 구매할 수 있는 홈페이지까지 알려준다. 또 단순히 검색 결과를 보여주는 데 그치지 않고 개인화한 답변, 더 정교한 답변을 보여주는 것이다.
예컨대 SGE를 통해 '경사가 있는 출퇴근 길에 탈만한 자전거'를 검색한다면 출퇴근용 자전거 구입 시 고려사항, 적합한 자전거와 가격과 구매 가능 사이트 링크, 사용자 후기 등을 볼 수 있다.
아직 SGE는 영어로만 소통이 가능하고 대기 명단에 올린 사람에 한해 순차적으로 이용이 가능하다. 구글은 충분한 테스트를 거쳐 이를 내놓기로 했다.
팜2는 구글 닥스(문서편집기), 클라우드(가상 서버), 구글 지도(구글 맵) 등 25개 기존 구글 서비스에도 적용됐다. 그 결과 구글포토를 사용할 경우 포토샵을 쓰지 않고도 사진에서 원하는 부분만 잘라 내거나, 위치도 재배치하고 배경 색도 바꿀 수 있다.
구글이 이번에 바드로 야심차게 노리는 영역 중 하나는 문서 작업이다. 구글은 지난 1년 간 워크스페이스 AI 기능을 통해 사용자가 1800억 번 이상 글을 쓸수 있도록 도왔다고 평가했다. 기존 구글 메일에는 짧은 답장을 보낼 수 있도록 하는 기능은 있었지만 구글 닥스와 AI서비스와 결합해 이메일 초안을 작성할 수도 있다는 점도 기존보다 향상된 기능이다.
만약 사용자가 항공사로부터 '비행일정 취소로 비용을 일부 환불해주겠다'는 메일을 받았다면 '답장(Reply)' 버튼을 누른 뒤 바드에 '전액 환불을 요구하는 메일을 작성해달라'라고 명령하면 초안 작성이 가능하다. 또 마음에 들지 않는다면 초안의 뉘앙스를 바꿀 수 있는 기능도 탑재했다.