RedaAlami
/

zephyr-7b-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora / runs /Oct04_08-33-02_ip-172-16-43-187.us-west-2.compute.internal /events.out.tfevents.1728049146.ip-172-16-43-187.us-west-2.compute.internal.82163.1

Commit History

End of training

04e7632
verified

RedaAlami commited on Oct 4