wanyuhe499
/

llm_judge_dpo_peft_iter2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llm_judge_dpo_peft_iter2 / runs

1 contributor

History: 4 commits

wanyuhe499's picture

End of training

5b2c469 verified 18 days ago