Minbyul
/

mistral-7b-dpo-full-wo-kqa_golden-ep3

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

mistral-7b-dpo-full-wo-kqa_golden-ep3 / README.md

Commit History

End of training

34618a4
verified

Minbyul commited on Apr 11

Model save

91fa69c
verified

Minbyul commited on Apr 11

Training in progress, step 100

3251ecb
verified

Minbyul commited on Apr 11