DUAL-GPO
/

phi-2-dpo-chatml-lora-40k-60k-v2-i2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-chatml-lora-40k-60k-v2-i2

Commit History

End of training

a00a7d3
verified

BraylonDash commited on Sep 12

Model save

e6f2538
verified

BraylonDash commited on Sep 12

Training in progress, step 300

c7483ea
verified

BraylonDash commited on Sep 12

Training in progress, step 200

d40adb0
verified

BraylonDash commited on Sep 12

Training in progress, step 100

cd6ca73
verified

BraylonDash commited on Sep 12

initial commit

ae5e18e
verified

BraylonDash commited on Sep 12