【论文导读】多模态大语言模型综述(三)训练技术和数据源
提示! 右键单击并选择“Save link as...”进行下载。
VIDEOS |
MP4 |
N/A |
480P |
下载
|
MP4 |
N/A |
360P |
下载
|
AUDIO |
MP4 |
N/A |
mp4a.40.2 |
下载
|
MP4 |
N/A |
mp4a.40.5 |
下载
|
MP4 |
N/A |
mp4a.40.2 |
下载
|
THUMBNAILS |
|
JPEG |
Origin Image |
下载
|
本篇综述介绍内容主要包括多模态大语言模型(MLLM)的相关概念(包括体系结构、训练策略和数据以及评估)、MLLM研究主题、MLLM幻觉、MLLM技术(包括多模态上下文学习、多模态思维链和语言模型辅助视觉推理)和展望。
综述论文:
@misc{yin2023survey,
title={A Survey on Multimodal Large Language Models},
author={Shukang Yin and Chaoyou Fu and Sirui Zhao and Ke Li and Xing Sun and Tong Xu and Enhong Chen},
year={2023},
eprint={2306.13549},
archivePrefix={arXiv},
primaryClass={cs.CV}
}