yakazimir
/

llama3instruct_-cpo-10-0_4-9e-7-1_best

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama3instruct_-cpo-10-0_4-9e-7-1_best / model-00003-of-00004.safetensors

Commit History

Training in progress, step 457

4e3d84a
verified

yakazimir commited on 3 days ago