yakazimir
/

qwen_cpo_entropy_0_3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen_cpo_entropy_0_3

Commit History

End of training

d6c4c57
verified

yakazimir commited on 21 days ago

Model save

4a90d6f
verified

yakazimir commited on 21 days ago

Training in progress, step 5604

22da528
verified

yakazimir commited on 21 days ago

End of training

ddb8fc9
verified

yakazimir commited on 21 days ago

Model save

0aa2b6b
verified

yakazimir commited on 21 days ago

Training in progress, step 5604

5a5a9af
verified

yakazimir commited on 21 days ago

initial commit

0ea32e0
verified

yakazimir commited on 22 days ago