似乎有点过拟合

#1
by WoolCool - opened

似乎有点过拟合,文本内容生成和续写很棒,非常流畅,但指令遵循差一点,总是沿着固定的路径走

感觉是Yi的问题,用原始的Yi-34B-Chat也是同样的问题。

Yi确实有这个问题,好像不少人提到了。https://huggingface.co/migtissera/Tess-M-Creative-v1.0 这个模型(作者说新版还在训练中)指令遵循不错,不会特别死板重复,请问是否考虑将来再用这个做基模训练一版?谢谢,至少这是目前看到的中文写作描写能力最流畅的了

我这个只是合并其它人的LoRA,Yi-Chat若出了新版也要看有资源的大佬是否有合并适配的LoRA出来。

WoolCool changed discussion status to closed

Sign up or log in to comment