ShenaoZ
/

0.0_withdpo_4iters_bs256_5102lr_misit_iter_1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

0.0_withdpo_4iters_bs256_5102lr_misit_iter_1

Commit History

End of training

1b25d0f
verified

ShenaoZ commited on May 3, 2024

Model save

8d0082d
verified

ShenaoZ commited on May 3, 2024

initial commit

5a19703
verified

ShenaoZ commited on May 3, 2024