wanyuhe499
/

llm_judge_dpo_peft_iter2

Generated from Trainer

Inference Endpoints

Model card Files Files and versions Metrics Training metrics Community

llm_judge_dpo_peft_iter2 / adapter_model.safetensors

Commit History

Training in progress, step 6

a5909be
verified

wanyuhe499 commited on 19 days ago

Training in progress, step 6

1e506c0
verified

wanyuhe499 commited on 19 days ago