wanyuhe499
/

llm_judge_dpo_peft_iter2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llm_judge_dpo_peft_iter2 / runs /Dec06_23-33-34_6f40f359a06f

Commit History

End of training

5b2c469
verified

wanyuhe499 commited on 23 days ago

Training in progress, step 1

0a09a84
verified

wanyuhe499 commited on 23 days ago