yakazimir
/

llama3instruct_-cpo-10-0_4-9e-7-1_best

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama3instruct_-cpo-10-0_4-9e-7-1_best / train_results.json

Commit History

Model save

9e30c3f
verified

yakazimir commited on 3 days ago