DUAL-GPO
/

phi-2-dpo-chatml-lora-40k-60k-i2

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

phi-2-dpo-chatml-lora-40k-60k-i2

Commit History

End of training

1626a8e
verified

BraylonDash commited on Sep 11

Model save

7d7328f
verified

BraylonDash commited on Sep 11

Training in progress, step 600

ef568a0
verified

BraylonDash commited on Sep 11

Training in progress, step 400

2cad568
verified

BraylonDash commited on Sep 11

Training in progress, step 300

6c537bf
verified

BraylonDash commited on Sep 11

Training in progress, step 200

84ebfe2
verified

BraylonDash commited on Sep 11

Training in progress, step 100

ddf180c
verified

BraylonDash commited on Sep 11

initial commit

ffdcfb3
verified

BraylonDash commited on Sep 11