请教一下，cogvlm和glm4v的区别是什么呢

by rangehow - opened Jun 5

Discussion

rangehow

Jun 5

如题

qwertyjack

Jun 5

根据github上README:

🔥🔥 News: 2024/6/5:We release GLM-4V-9B, which use the same data and training recipes as CogVLM2 but
with GLM-9B as the language backbone. We removed visual experts to reduce the model size to 13B. More
details at GLM-4 repo.

所以区别在于语言模型部分。

zRzRzRzRzRzRzR

Knowledge Engineering Group (KEG) & Data Mining at Tsinghua University org Jun 7

如果使用中文对话，可以选择glm-4v，主要在语言模型的区分，当然GLM-4V-9B没有做视觉专家部分，如果你想了解关于这部分的内容，可以关注cogvlm 和cogagent的论文

zRzRzRzRzRzRzR changed discussion status to closed Jun 7

weilai1

Jun 15

如果使用中文对话，可以选择glm-4v，主要在语言模型的区分，当然GLM-4V-9B没有做视觉专家部分，如果你想了解关于这部分的内容，可以关注cogvlm 和cogagent的论文

想了解一下glm-4v-9B的训练过程，没有visual experts 部分后，训练的时候是仅训练MLP对齐模块和视觉模块吗，还是视觉模型和MLP对齐模块以及语言模型参数同时更新呢？

Upload images, audio, and videos by dragging in the text input, pasting, or clicking here.

Tap or paste here to upload images

· Sign up or log in to comment