DUAL-GPO
/

phi-2-dpo-chatml-lora-10k-30k-i1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-chatml-lora-10k-30k-i1 / runs /Sep10_19-37-45_gpu4-119-5

Commit History

Model save

18011e1
verified

BraylonDash commited on Sep 10

Training in progress, step 600

2066bc3
verified

BraylonDash commited on Sep 10

Training in progress, step 500

7e35958
verified

BraylonDash commited on Sep 10