yakazimir
/

llama3instruct_-orpo-10-0_5-1e-6-1_best

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama3instruct_-orpo-10-0_5-1e-6-1_best / model-00001-of-00004.safetensors

Commit History

Training in progress, step 457

a7b0678
verified

yakazimir commited on 3 days ago