dmis-lab
/

self-biorag-7b-olaph

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

dmis-lab commited on May 22

Commit

de02780

•

1 Parent(s): 9a95375

Update README.md

Files changed (1) hide show

README.md +3 -3

README.md CHANGED Viewed

@@ -8,11 +8,11 @@ tags:
 - trl
 - dpo
 - generated_from_trainer
-datasets:
-- HuggingFaceH4/ultrafeedback_binarized
 model-index:
 - name: selfbiorag-7b-wo-kqa_golden-iter-dpo-step4-filtered
   results: []
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
@@ -72,4 +72,4 @@ The following hyperparameters were used during training:
 - Transformers 4.39.0.dev0
 - Pytorch 2.1.2
 - Datasets 2.14.6
-- Tokenizers 0.15.2

 - trl
 - dpo
 - generated_from_trainer
 model-index:
 - name: selfbiorag-7b-wo-kqa_golden-iter-dpo-step4-filtered
   results: []
+language:
+- en
 ---
 <!-- This model card has been generated automatically according to the information the Trainer had access to. You
 - Transformers 4.39.0.dev0
 - Pytorch 2.1.2
 - Datasets 2.14.6
+- Tokenizers 0.15.2