RedaAlami
/

zephyr-7b-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora / runs /Aug01_05-32-03_ip-172-16-25-216.us-west-2.compute.internal /events.out.tfevents.1722490483.ip-172-16-25-216.us-west-2.compute.internal.77868.0

Commit History

Training in progress, step 331

3f725b1
verified

RedaAlami commited on Aug 1, 2024

Training in progress, step 300

a3b9cb7
verified

RedaAlami commited on Aug 1, 2024

Training in progress, step 200

1a6e4c1
verified

RedaAlami commited on Aug 1, 2024

Training in progress, step 100

e3e9454
verified

RedaAlami commited on Aug 1, 2024