yiran-wang3
/

ds_chat_no_mask_sppo_hard_new_iter0_all_pairs

alignment-handbook

Generated from Trainer

Model card Files Files and versions Community

ds_chat_no_mask_sppo_hard_new_iter0_all_pairs

Commit History

End of training

59f0ceb
verified

yiran-wang3 commited on Oct 6

Model save

cb5dd4c
verified

yiran-wang3 commited on Oct 6

Training in progress, epoch 1

3da9e80
verified

yiran-wang3 commited on Oct 6

initial commit

41a83f9
verified

yiran-wang3 commited on Oct 6