hZzy
/

qwen2.5-0.5b-expo-DPO-EXPERIMENT-0.1-5e6

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

qwen2.5-0.5b-expo-DPO-EXPERIMENT-0.1-5e6 / train_results.json

Commit History

Model save

0211cad
verified

hZzy commited on 7 days ago