wanyuhe499
/

llm_judge_dpo_peft_iter2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llm_judge_dpo_peft_iter2 / training_args.bin

Commit History

Training in progress, step 1

2ce03f2
verified

wanyuhe499 commited on 12 days ago

Training in progress, step 1

4d6db82
verified

wanyuhe499 commited on 12 days ago

Training in progress, step 1

900c5ed
verified

wanyuhe499 commited on 12 days ago

Training in progress, step 1

0a09a84
verified

wanyuhe499 commited on 12 days ago

Training in progress, step 6

a5909be
verified

wanyuhe499 commited on 12 days ago

Training in progress, step 6

1e506c0
verified

wanyuhe499 commited on 12 days ago