wanyuhe499
/

llm_judge_dpo_peft_iter2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llm_judge_dpo_peft_iter2 / runs /Dec07_00-50-25_b7f1e1f897fe /events.out.tfevents.1733532685.b7f1e1f897fe.2874.1

Commit History

Training in progress, step 10

19c779f
verified

wanyuhe499 commited on 16 days ago

Training in progress, step 1

2ce03f2
verified

wanyuhe499 commited on 16 days ago