wanyuhe499
/

llm_judge_dpo_peft_iter2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llm_judge_dpo_peft_iter2 / runs

1 contributor

History: 8 commits

wanyuhe499's picture

End of training

3f9b833 verified 23 days ago