![](https://img.newspim.com/news/2024/06/20/2406201051176710_t3.jpg)
KAIST, GPT-4 버전의 시각 멀티모달 성능 뛰어넘는 대형 언어모델 개발
... 기존 멀티모달 대형언어모델은 텍스트에 의미적으로 정렬된 시각 인코더(vision encoder)만을 사용한다....
2024-06-20 10:52