apfurman
/

gemma-2b-dolly-qa

Generated from Trainer

Model card Files Files and versions Community

apfurman commited on Apr 28, 2024

Commit

4e1f279

·

verified ·

1 Parent(s): 79943a0

Model save

Files changed (2) hide show

README.md +1 -25
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -6,8 +6,6 @@ tags:
 - sft
 - generated_from_trainer
 base_model: google/gemma-2b
-datasets:
-- generator
 model-index:
 - name: gemma-2b-dolly-qa
   results: []
@@ -18,9 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 # gemma-2b-dolly-qa
-This model is a fine-tuned version of [google/gemma-2b](https://huggingface.co/google/gemma-2b) on the generator dataset.
-It achieves the following results on the evaluation set:
-- Loss: 2.0198
 ## Model description
@@ -50,26 +46,6 @@ The following hyperparameters were used during training:
 - lr_scheduler_warmup_ratio: 0.05
 - training_steps: 1480
-### Training results
-| Training Loss | Epoch   | Step | Validation Loss |
-|:-------------:|:-------:|:----:|:---------------:|
-| 2.918         | 1.6393  | 100  | 2.5702          |
-| 2.4342        | 3.2787  | 200  | 2.2747          |
-| 2.2482        | 4.9180  | 300  | 2.1601          |
-| 2.1554        | 6.5574  | 400  | 2.0971          |
-| 2.1022        | 8.1967  | 500  | 2.0698          |
-| 2.0806        | 9.8361  | 600  | 2.0544          |
-| 2.0651        | 11.4754 | 700  | 2.0437          |
-| 2.0439        | 13.1148 | 800  | 2.0359          |
-| 2.0369        | 14.7541 | 900  | 2.0302          |
-| 2.034         | 16.3934 | 1000 | 2.0263          |
-| 2.0249        | 18.0328 | 1100 | 2.0236          |
-| 2.0174        | 19.6721 | 1200 | 2.0218          |
-| 2.0154        | 21.3115 | 1300 | 2.0203          |
-| 2.0145        | 22.9508 | 1400 | 2.0198          |
 ### Framework versions
 - PEFT 0.10.0

 - sft
 - generated_from_trainer
 base_model: google/gemma-2b
 model-index:
 - name: gemma-2b-dolly-qa
   results: []
 # gemma-2b-dolly-qa
+This model is a fine-tuned version of [google/gemma-2b](https://huggingface.co/google/gemma-2b) on an unknown dataset.
 ## Model description
 - lr_scheduler_warmup_ratio: 0.05
 - training_steps: 1480
 ### Framework versions
 - PEFT 0.10.0

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:19c7678ed7c393058c4a6cc50a627b3e8be13e836eaefc1fd5c38b94b4a8e717
 size 156926880

 version https://git-lfs.github.com/spec/v1
+oid sha256:4aab9486e68c58fdbdb93455ee42186b43e0d482e332a83f0962f6d6019976b8
 size 156926880