🍻 cheers

Browse files

Files changed (6) hide show

README.md +2 -1
all_results.json +10 -10
eval_results.json +6 -6
runs/Mar26_19-46-27_ryanserver/events.out.tfevents.1711497195.ryanserver.29921.1 +3 -0
train_results.json +4 -4
trainer_state.json +188 -35

README.md CHANGED Viewed

@@ -2,6 +2,7 @@
 license: apache-2.0
 base_model: google/vit-base-patch16-224-in21k
 tags:
 - generated_from_trainer
 model-index:
 - name: ryan_model314
@@ -13,7 +14,7 @@ should probably proofread and complete it, then remove this comment. -->
 # ryan_model314
-This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the None dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.2939
 - Na Accuracy: 0.945

 license: apache-2.0
 base_model: google/vit-base-patch16-224-in21k
 tags:
+- image-classification
 - generated_from_trainer
 model-index:
 - name: ryan_model314
 # ryan_model314
+This model is a fine-tuned version of [google/vit-base-patch16-224-in21k](https://huggingface.co/google/vit-base-patch16-224-in21k) on the beans dataset.
 It achieves the following results on the evaluation set:
 - Loss: 0.2939
 - Na Accuracy: 0.945

all_results.json CHANGED Viewed

@@ -1,14 +1,14 @@
 {
     "epoch": 4.0,
     "eval_accuracy": 0.628,
-    "eval_loss": 0.29625898599624634,
-    "eval_na_accuracy": 0.952,
-    "eval_ordinal_accuracy": 0.5119617224880383,
-    "eval_runtime": 23.9544,
-    "eval_samples_per_second": 10.437,
-    "eval_steps_per_second": 1.336,
-    "train_loss": 0.2629110822454095,
-    "train_runtime": 64.8307,
-    "train_samples_per_second": 15.425,
-    "train_steps_per_second": 0.987
 }

 {
     "epoch": 4.0,
     "eval_accuracy": 0.628,
+    "eval_loss": 0.29386183619499207,
+    "eval_na_accuracy": 0.945,
+    "eval_ordinal_accuracy": 0.5705521472392638,
+    "eval_runtime": 8.2243,
+    "eval_samples_per_second": 24.318,
+    "eval_steps_per_second": 3.04,
+    "train_loss": 0.212149089468377,
+    "train_runtime": 378.6413,
+    "train_samples_per_second": 10.564,
+    "train_steps_per_second": 0.666
 }

eval_results.json CHANGED Viewed

@@ -1,9 +1,9 @@
 {
     "epoch": 4.0,
-    "eval_loss": 0.29625898599624634,
-    "eval_na_accuracy": 0.952,
-    "eval_ordinal_accuracy": 0.5119617224880383,
-    "eval_runtime": 23.9544,
-    "eval_samples_per_second": 10.437,
-    "eval_steps_per_second": 1.336
 }

 {
     "epoch": 4.0,
+    "eval_loss": 0.29386183619499207,
+    "eval_na_accuracy": 0.945,
+    "eval_ordinal_accuracy": 0.5705521472392638,
+    "eval_runtime": 8.2243,
+    "eval_samples_per_second": 24.318,
+    "eval_steps_per_second": 3.04
 }

runs/Mar26_19-46-27_ryanserver/events.out.tfevents.1711497195.ryanserver.29921.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:ce4c3f3a2449fd4fdda1a08f3cfd96da5dbe378b026a038b44eb4a24079cb4c0
+size 474

train_results.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
     "epoch": 4.0,
-    "train_loss": 0.2629110822454095,
-    "train_runtime": 64.8307,
-    "train_samples_per_second": 15.425,
-    "train_steps_per_second": 0.987
 }

 {
     "epoch": 4.0,
+    "train_loss": 0.212149089468377,
+    "train_runtime": 378.6413,
+    "train_samples_per_second": 10.564,
+    "train_steps_per_second": 0.666
 }

trainer_state.json CHANGED Viewed

@@ -1,71 +1,224 @@
 {
-  "best_metric": null,
-  "best_model_checkpoint": null,
   "epoch": 4.0,
   "eval_steps": 100,
-  "global_step": 64,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.62,
-      "grad_norm": 1.1892509460449219,
-      "learning_rate": 0.00016875,
-      "loss": 0.5447,
       "step": 10
     },
     {
-      "epoch": 1.25,
-      "grad_norm": 1.315897822380066,
-      "learning_rate": 0.0001375,
-      "loss": 0.408,
       "step": 20
     },
     {
-      "epoch": 1.88,
-      "grad_norm": 0.7632724046707153,
-      "learning_rate": 0.00010625000000000001,
-      "loss": 0.2444,
       "step": 30
     },
     {
-      "epoch": 2.5,
-      "grad_norm": 0.5031312704086304,
-      "learning_rate": 7.500000000000001e-05,
-      "loss": 0.1791,
       "step": 40
     },
     {
-      "epoch": 3.12,
-      "grad_norm": 0.6666581630706787,
-      "learning_rate": 4.375e-05,
-      "loss": 0.1459,
       "step": 50
     },
     {
-      "epoch": 3.75,
-      "grad_norm": 0.8803956508636475,
-      "learning_rate": 1.25e-05,
-      "loss": 0.1187,
       "step": 60
     },
     {
       "epoch": 4.0,
-      "step": 64,
-      "total_flos": 7.749476775936e+16,
-      "train_loss": 0.2629110822454095,
-      "train_runtime": 64.8307,
-      "train_samples_per_second": 15.425,
-      "train_steps_per_second": 0.987
     }
   ],
   "logging_steps": 10,
-  "max_steps": 64,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 4,
   "save_steps": 100,
-  "total_flos": 7.749476775936e+16,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.29386183619499207,
+  "best_model_checkpoint": "./ryan_model314/checkpoint-200",
   "epoch": 4.0,
   "eval_steps": 100,
+  "global_step": 252,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.16,
+      "grad_norm": 1.1858803033828735,
+      "learning_rate": 0.00019206349206349208,
+      "loss": 0.5736,
       "step": 10
     },
     {
+      "epoch": 0.32,
+      "grad_norm": 1.41181480884552,
+      "learning_rate": 0.00018412698412698412,
+      "loss": 0.4142,
       "step": 20
     },
     {
+      "epoch": 0.48,
+      "grad_norm": 0.6347964406013489,
+      "learning_rate": 0.0001761904761904762,
+      "loss": 0.3916,
       "step": 30
     },
     {
+      "epoch": 0.63,
+      "grad_norm": 0.7893273234367371,
+      "learning_rate": 0.00016825396825396826,
+      "loss": 0.3628,
       "step": 40
     },
     {
+      "epoch": 0.79,
+      "grad_norm": 0.9887136816978455,
+      "learning_rate": 0.00016031746031746033,
+      "loss": 0.3852,
       "step": 50
     },
     {
+      "epoch": 0.95,
+      "grad_norm": 1.1596781015396118,
+      "learning_rate": 0.00015238095238095237,
+      "loss": 0.3962,
       "step": 60
     },
+    {
+      "epoch": 1.11,
+      "grad_norm": 1.1897984743118286,
+      "learning_rate": 0.00014444444444444444,
+      "loss": 0.2923,
+      "step": 70
+    },
+    {
+      "epoch": 1.27,
+      "grad_norm": 0.5242781639099121,
+      "learning_rate": 0.0001365079365079365,
+      "loss": 0.2335,
+      "step": 80
+    },
+    {
+      "epoch": 1.43,
+      "grad_norm": 1.0704305171966553,
+      "learning_rate": 0.00012857142857142858,
+      "loss": 0.268,
+      "step": 90
+    },
+    {
+      "epoch": 1.59,
+      "grad_norm": 0.852606475353241,
+      "learning_rate": 0.00012063492063492063,
+      "loss": 0.1969,
+      "step": 100
+    },
+    {
+      "epoch": 1.59,
+      "eval_loss": 0.2954840064048767,
+      "eval_na_accuracy": 0.945,
+      "eval_ordinal_accuracy": 0.4785276073619632,
+      "eval_runtime": 26.5841,
+      "eval_samples_per_second": 7.523,
+      "eval_steps_per_second": 0.94,
+      "step": 100
+    },
+    {
+      "epoch": 1.75,
+      "grad_norm": 0.6733121871948242,
+      "learning_rate": 0.0001126984126984127,
+      "loss": 0.2328,
+      "step": 110
+    },
+    {
+      "epoch": 1.9,
+      "grad_norm": 0.9004744291305542,
+      "learning_rate": 0.00010476190476190477,
+      "loss": 0.2248,
+      "step": 120
+    },
+    {
+      "epoch": 2.06,
+      "grad_norm": 3.1687183380126953,
+      "learning_rate": 9.682539682539682e-05,
+      "loss": 0.1717,
+      "step": 130
+    },
+    {
+      "epoch": 2.22,
+      "grad_norm": 0.6659616827964783,
+      "learning_rate": 8.888888888888889e-05,
+      "loss": 0.145,
+      "step": 140
+    },
+    {
+      "epoch": 2.38,
+      "grad_norm": 0.6846858859062195,
+      "learning_rate": 8.095238095238096e-05,
+      "loss": 0.1157,
+      "step": 150
+    },
+    {
+      "epoch": 2.54,
+      "grad_norm": 0.6155730485916138,
+      "learning_rate": 7.301587301587302e-05,
+      "loss": 0.1424,
+      "step": 160
+    },
+    {
+      "epoch": 2.7,
+      "grad_norm": 0.6559838056564331,
+      "learning_rate": 6.507936507936509e-05,
+      "loss": 0.1041,
+      "step": 170
+    },
+    {
+      "epoch": 2.86,
+      "grad_norm": 0.4849882423877716,
+      "learning_rate": 5.714285714285714e-05,
+      "loss": 0.1339,
+      "step": 180
+    },
+    {
+      "epoch": 3.02,
+      "grad_norm": 0.6311644911766052,
+      "learning_rate": 4.9206349206349204e-05,
+      "loss": 0.103,
+      "step": 190
+    },
+    {
+      "epoch": 3.17,
+      "grad_norm": 0.8323171138763428,
+      "learning_rate": 4.126984126984127e-05,
+      "loss": 0.0746,
+      "step": 200
+    },
+    {
+      "epoch": 3.17,
+      "eval_loss": 0.29386183619499207,
+      "eval_na_accuracy": 0.945,
+      "eval_ordinal_accuracy": 0.5705521472392638,
+      "eval_runtime": 8.3287,
+      "eval_samples_per_second": 24.013,
+      "eval_steps_per_second": 3.002,
+      "step": 200
+    },
+    {
+      "epoch": 3.33,
+      "grad_norm": 0.8798254132270813,
+      "learning_rate": 3.3333333333333335e-05,
+      "loss": 0.086,
+      "step": 210
+    },
+    {
+      "epoch": 3.49,
+      "grad_norm": 0.37054240703582764,
+      "learning_rate": 2.5396825396825397e-05,
+      "loss": 0.0933,
+      "step": 220
+    },
+    {
+      "epoch": 3.65,
+      "grad_norm": 0.46293869614601135,
+      "learning_rate": 1.746031746031746e-05,
+      "loss": 0.066,
+      "step": 230
+    },
+    {
+      "epoch": 3.81,
+      "grad_norm": 0.3859086334705353,
+      "learning_rate": 9.523809523809523e-06,
+      "loss": 0.0649,
+      "step": 240
+    },
+    {
+      "epoch": 3.97,
+      "grad_norm": 0.300207257270813,
+      "learning_rate": 1.5873015873015873e-06,
+      "loss": 0.0623,
+      "step": 250
+    },
     {
       "epoch": 4.0,
+      "step": 252,
+      "total_flos": 3.0997907103744e+17,
+      "train_loss": 0.212149089468377,
+      "train_runtime": 378.6413,
+      "train_samples_per_second": 10.564,
+      "train_steps_per_second": 0.666
     }
   ],
   "logging_steps": 10,
+  "max_steps": 252,
   "num_input_tokens_seen": 0,
   "num_train_epochs": 4,
   "save_steps": 100,
+  "total_flos": 3.0997907103744e+17,
   "train_batch_size": 16,
   "trial_name": null,
   "trial_params": null