세계 최대 오픈소스 커뮤니티 깃허브에 공개
텍스트로 명령어 입력 시 실시간 이미지 제작 가능
[서울=뉴스핌] 진현우 인턴기자 = 카카오가 글을 쓰는 것을 넘어 그림까지 그릴 수 있는 인공지능(AI)을 개발해 공개했다.
카카오브레인은 초거대 AI 멀티모달(복수 신체정보 조합) 'minDALL-E'를 세계 최대 오픈소스(무상 공개 소프트웨어) 커뮤니티 깃허브에 공개했다고 15일 밝혔다. 지난달 한국어 특화 AI 언어모델 'KoGPT'를 선보인 지 1달 만에 두 번째 초거대 AI 모델을 오픈소스로 공개한 것이다.
minDALL-E는 이용자가 텍스트로 명령어를 입력하면 실시간으로 원하는 이미지를 만들어주는 이미지 생성 모델이다. 이를 위해 minDALL-E는 지금까지 1400만장의 텍스트와 이미지 세트를 사전 학습했다.
[사진=카카오브레인] |
예를 들어 "보름달과 파리 에펠탑이 같이 있는 그림 보여줘"라는 명령어를 입력하면 AI가 명령어의 맥락을 이해하고 바로 이미지를 도출한다. 검색을 통해 이미지를 찾아내는 것이 아니라 AI가 스스로 명령을 이해하고 직접 이미지를 그리는 것이다.
카카오브레인 관계자는 minDALL-E에 대해 "스토리텔링 콘텐츠의 삽화를 만들거나 교육 자료 제작 등에 활용하는 등 다양한 콘텐츠 산업에 적용할 수 있을 것으로 기대된다"고 설명했다.
이와 관련 카카오브레인은 오는 17일 '오픈 미니 컨퍼런스'를 온라인으로 개최하고 KoGPT와 minDALL-E에 대해 자세히 설명하는 자리를 갖는다.
김일두 카카오브레인 대표는 "최근 공개한 언어 모델 KoGPT과 이번에 공개한 minDALL-E를 시작으로 초거대 AI의 다양한 모델을 순차적으로 공개하겠다"며 "이는 차세대 딥러닝 구축을 위한 필수 연구 과정으로 해당 모델을 오픈 소스로 공개해 국내 IT 생태계 기술 발전에 기여할 것이다"라고 말했다.
hwjin@newspim.com