yakazimir
/

llama3instruct_-orpo-10-0_5-1e-6-1_best

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama3instruct_-orpo-10-0_5-1e-6-1_best / tokenizer.json

Commit History

Training in progress, step 457

a7b0678
verified

yakazimir commited on 6 days ago