RedaAlami
/

zephyr-7b-dpo-qlora

alignment-handbook

Generated from Trainer

4-bit precision

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-qlora / runs /Oct04_08-33-02_ip-172-16-43-187.us-west-2.compute.internal

1 contributor

History: 33 commits

RedaAlami's picture

End of training

04e7632 verified 3 months ago

events.out.tfevents.1728032903.ip-172-16-43-187.us-west-2.compute.internal.82163.0

249 kB
LFS

Training in progress, step 3179 3 months ago
events.out.tfevents.1728049146.ip-172-16-43-187.us-west-2.compute.internal.82163.1

828 Bytes
LFS

End of training 3 months ago