lewtun
/

gemma-7b-dpo-full-mix1-beta-0.05-epoch-2

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

gemma-7b-dpo-full-mix1-beta-0.05-epoch-2

Commit History

End of training

ebb0305
verified

lewtun HF staff commited on Mar 1, 2024

Model save

58e897c
verified

lewtun HF staff commited on Mar 1, 2024

Training in progress, step 100

2f75610
verified

lewtun HF staff commited on Mar 1, 2024

initial commit

4799bba
verified

lewtun HF staff commited on Mar 1, 2024