wanyuhe499
/

llm_judge_dpo_peft_iter2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llm_judge_dpo_peft_iter2 / tokenizer.json

Commit History

Training in progress, step 6

1e506c0
verified

wanyuhe499 commited on 14 days ago