캡셔닝 AI의 제로샷 이미지 캡셔닝 기술 선보여
[서울=뉴스핌] 이지용 기자 = LG AI 연구원이 세계 최대 컴퓨터 비전 학회에서 이미지 캡션과 키워드를 생성하는 '캡셔닝 인공지능(AI)'을 공개했다고 19일 밝혔다.
LG AI 연구원은 최근 캐나다 벤쿠버에서 열리고 있는 세계 최대 컴퓨터 비전 학회 'CVPR 2023'에서 생성형 AI 상용화 서비스인 캡셔닝 AI의 '제로샷 이미지 캡셔닝' 기술 등을 선보였다. 캡셔닝 AI는 인간처럼 처음 보는 이미지까지 자연어로 설명할 수 있는 AI로 이미지 검색에 활용할 수 있는 정보인 문장이나 키워드 등 메타 데이터를 생성한다. 제로샷 이미지 캡셔닝은 AI가 기존에 학습한 대량의 이미지와 텍스트 데이터를 기반으로 배경과 인물 등 이미지의 다양한 요소를 인식하고 관계를 설명할 수 있게 하는 기술이다.
18일 진행한 워크숍에서 이홍락 LG AI 연구원이 캡셔닝 AI에 적용한 제로샷 이미지 캡셔닝 기술에 대해 설명하고 있다. [사진=LG 제공] |
LG AI 연구원은 이번 학회에서 대량의 이미지를 관리해야 하는 기업들의 업무 효율성과 생산성을 높일 수 있는 점 등 캡셔닝 AI의 기술을 선보인다. 캡셔닝 AI를 활용하면 이미지 범위를 1만 장으로 확장해 2일 이내에 작업을 끝낼 수 있어 맞춤형 이미지 검색·관리 시스템 구축 등이 가능하다.
LG AI 연구원은 이번 학회 기간 중 LG 부스를 방문한 연구자들을 대상으로 캡셔닝 AI 서비스를 시연할 예정이다.
앞서 LG AI 연구원은 캡셔닝 AI 개발을 위해 이미지 등 콘텐츠가 매일 수십만 개 이상 추가되는 세계 최대 플랫폼 기업인 셔터스톡과 협업을 해왔다.
LG AI 연구원은 캡셔닝 AI 기반 기술인 제로샷 이미지 캡셔닝을 주제로 셔터스톡 및 서울대 AI대학원과 워트숍도 진행했다. 세계적인 전문가들이 참여해 최신 연구 동향과 미래 전망, AI 윤리 등 기술이 사회에 미치는 영향에 관한 논의를 했다.
leeiy5222@newspim.com