ShenaoZ
/

0.001_withdpo_4iters_bs256_5102lr_misit_iter_2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.001_withdpo_4iters_bs256_5102lr_misit_iter_2

Commit History

End of training

6abc698
verified

ShenaoZ commited on May 4, 2024

Model save

22bc386
verified

ShenaoZ commited on May 4, 2024

End of training

5f73ff2
verified

ShenaoZ commited on May 3, 2024

Model save

d3a5538
verified

ShenaoZ commited on May 3, 2024

initial commit

708a8b6
verified

ShenaoZ commited on May 3, 2024