yakazimir
/

qwen_cpo_entropy_0_01

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

qwen_cpo_entropy_0_01

Commit History

Model save

4309889
verified

yakazimir commited on 28 days ago

Training in progress, step 5604

8133285
verified

yakazimir commited on 28 days ago

initial commit

6bd6e92
verified

yakazimir commited on 29 days ago