wanyuhe499
/

llm_judge_dpo_peft_iter2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llm_judge_dpo_peft_iter2 / runs /Dec06_23-53-27_6f40f359a06f /events.out.tfevents.1733529242.6f40f359a06f.1124.13

Commit History

End of training

6d9c4d6
verified

wanyuhe499 commited on 15 days ago

Training in progress, step 22

be9fc96
verified

wanyuhe499 commited on 15 days ago

Training in progress, step 11

5e08945
verified

wanyuhe499 commited on 15 days ago

Training in progress, step 1

4d6db82
verified

wanyuhe499 commited on 15 days ago