migaraa
/

Gemma2B-LORAfied

Generated from Trainer

Model card Files Files and versions Community

Migara Amarasinghe commited on Apr 12, 2024

Commit

d47c79b

·

verified ·

1 Parent(s): 3e8cfbc

Model save

Files changed (2) hide show

README.md +4 -19
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -5,8 +5,6 @@ tags:
 - trl
 - sft
 - generated_from_trainer
-datasets:
-- generator
 base_model: google/gemma-2b
 model-index:
 - name: Gemma2B-LORAfied
@@ -18,9 +16,7 @@ should probably proofread and complete it, then remove this comment. -->
 # Gemma2B-LORAfied
-This model is a fine-tuned version of [google/gemma-2b](https://huggingface.co/google/gemma-2b) on the generator dataset.
-It achieves the following results on the evaluation set:
-- Loss: 2.1460
 ## Model description
@@ -43,23 +39,12 @@ The following hyperparameters were used during training:
 - train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
-- gradient_accumulation_steps: 4
-- total_train_batch_size: 8
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.05
-- training_steps: 593
-### Training results
-| Training Loss | Epoch | Step | Validation Loss |
-|:-------------:|:-----:|:----:|:---------------:|
-| 2.8443        | 0.82  | 100  | 2.5332          |
-| 2.4577        | 1.64  | 200  | 2.3103          |
-| 2.275         | 2.46  | 300  | 2.2143          |
-| 2.2331        | 3.28  | 400  | 2.1686          |
-| 2.1737        | 4.1   | 500  | 2.1460          |
 ### Framework versions

 - trl
 - sft
 - generated_from_trainer
 base_model: google/gemma-2b
 model-index:
 - name: Gemma2B-LORAfied
 # Gemma2B-LORAfied
+This model is a fine-tuned version of [google/gemma-2b](https://huggingface.co/google/gemma-2b) on an unknown dataset.
 ## Model description
 - train_batch_size: 2
 - eval_batch_size: 8
 - seed: 42
+- gradient_accumulation_steps: 8
+- total_train_batch_size: 16
 - optimizer: Adam with betas=(0.9,0.999) and epsilon=1e-08
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_ratio: 0.05
+- training_steps: 1480
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:76fdc29fd385771b6b35b868d080c23709439a3b2cd71ea71fec345c39732356
 size 156926880

 version https://git-lfs.github.com/spec/v1
+oid sha256:94e1e95f6be5b6e3f9b047c96a4604dda809c956c5cfc1ef9325c04d5df37378
 size 156926880