RedaAlami
/

zephyr-7b-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora / runs /Aug01_05-32-03_ip-172-16-25-216.us-west-2.compute.internal /events.out.tfevents.1722490483.ip-172-16-25-216.us-west-2.compute.internal.77868.0

Commit History

Training in progress, step 331

3f725b1
verified

RedaAlami commited on Aug 1

Training in progress, step 300

a3b9cb7
verified

RedaAlami commited on Aug 1

Training in progress, step 200

1a6e4c1
verified

RedaAlami commited on Aug 1

Training in progress, step 100

e3e9454
verified

RedaAlami commited on Aug 1