请教一下,cogvlm和glm4v的区别是什么呢

#1
by rangehow - opened

如题

根据github上README:

🔥🔥 News: 2024/6/5:We release GLM-4V-9B, which use the same data and training recipes as CogVLM2 but
with GLM-9B as the language backbone. We removed visual experts to reduce the model size to 13B. More
details at GLM-4 repo.

所以区别在于语言模型部分。

Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University org

如果使用 中文对话,可以选择glm-4v,主要在语言模型的区分,当然GLM-4V-9B没有做视觉专家部分,如果你想了解关于这部分的内容,可以关注cogvlm 和cogagent的论文

zRzRzRzRzRzRzR changed discussion status to closed

如果使用 中文对话,可以选择glm-4v,主要在语言模型的区分,当然GLM-4V-9B没有做视觉专家部分,如果你想了解关于这部分的内容,可以关注cogvlm 和cogagent的论文

想了解一下glm-4v-9B的训练过程,没有visual experts 部分后,训练的时候是仅训练MLP对齐模块和视觉模块吗,还是视觉模型和MLP对齐模块以及语言模型参数同时更新呢?

Sign up or log in to comment