sfulay
/

zephyr-7b-dpo-full-gpt-reward-scale-01

Generated from Trainer

Model card Files Files and versions Community

zephyr-7b-dpo-full-gpt-reward-scale-01

Commit History

Model save

4633087
verified

sfulay commited on Sep 2, 2024

Training in progress, step 436

0dbdb13
verified

sfulay commited on Sep 2, 2024

Training in progress, step 400

a690582
verified

sfulay commited on Sep 2, 2024

Training in progress, step 300

bd73342
verified

sfulay commited on Sep 2, 2024

Training in progress, step 200

4a29987
verified

sfulay commited on Sep 2, 2024

Training in progress, step 100

dd59802
verified

sfulay commited on Sep 2, 2024

initial commit

10fae38
verified

sfulay commited on Aug 29, 2024