palicoqiqi
/

paligemma_vqav2

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

palicoqiqi commited on Nov 11, 2024

Commit

fb1626f

·

verified ·

1 Parent(s): 694a069

palicoqiqi/paligemma_VQAv2_enel645

Files changed (2) hide show

README.md +20 -1
adapter_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -15,6 +15,8 @@ should probably proofread and complete it, then remove this comment. -->
 # paligemma_vqav2
 This model is a fine-tuned version of [google/paligemma-3b-pt-224](https://huggingface.co/google/paligemma-3b-pt-224) on an unknown dataset.
 ## Model description
@@ -42,7 +44,24 @@ The following hyperparameters were used during training:
 - optimizer: Use OptimizerNames.ADAMW_HF with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
-- num_epochs: 10
 ### Framework versions

 # paligemma_vqav2
 This model is a fine-tuned version of [google/paligemma-3b-pt-224](https://huggingface.co/google/paligemma-3b-pt-224) on an unknown dataset.
+It achieves the following results on the evaluation set:
+- Loss: 0.2576
 ## Model description
 - optimizer: Use OptimizerNames.ADAMW_HF with betas=(0.9,0.999) and epsilon=1e-08 and optimizer_args=No additional optimizer arguments
 - lr_scheduler_type: linear
 - lr_scheduler_warmup_steps: 2
+- num_epochs: 11
+### Training results
+| Training Loss | Epoch   | Step | Validation Loss |
+|:-------------:|:-------:|:----:|:---------------:|
+| No log        | 0.9976  | 318  | 0.4476          |
+| 1.7322        | 1.9984  | 637  | 0.3353          |
+| 1.7322        | 2.9992  | 956  | 0.3288          |
+| 0.2942        | 4.0     | 1275 | 0.2902          |
+| 0.219         | 4.9976  | 1593 | 0.2842          |
+| 0.219         | 5.9984  | 1912 | 0.2551          |
+| 0.189         | 6.9992  | 2231 | 0.2656          |
+| 0.1596        | 8.0     | 2550 | 0.2686          |
+| 0.1596        | 8.9976  | 2868 | 0.2524          |
+| 0.138         | 9.9984  | 3187 | 0.2601          |
+| 0.138         | 10.9741 | 3498 | 0.2576          |
 ### Framework versions

adapter_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:9245f105ede0b2214dcac20633fd44d6632e4b71929e8e065dcd013549c7adbb
 size 45258384

 version https://git-lfs.github.com/spec/v1
+oid sha256:beeed0f06a9c85f0d120039701ca07f1e3abd0f9270e2d271172dfa51611cf80
 size 45258384