Minbyul
/

llama3-8b-instruct-wo-kqa_golden-iter-dpo-step1

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

llama3-8b-instruct-wo-kqa_golden-iter-dpo-step1

Commit History

End of training

e0ab4fb
verified

Minbyul commited on Jun 18, 2024

Model save

5400025
verified

Minbyul commited on Jun 18, 2024

initial commit

ee56ae3
verified

Minbyul commited on Jun 18, 2024