Brain MRI fine tune run - 20 epochs.

Browse files

Files changed (6) hide show

README.md +4 -3
all_results.json +11 -11
eval_results.json +6 -6
runs/Aug28_15-52-04_DESKTOP-4SGMSGR/events.out.tfevents.1724850055.DESKTOP-4SGMSGR.2900.1 +3 -0
train_results.json +6 -6
trainer_state.json +192 -119

README.md CHANGED Viewed

@@ -3,6 +3,7 @@ library_name: transformers
 license: apache-2.0
 base_model: google/vit-base-patch16-224
 tags:
 - generated_from_trainer
 metrics:
 - accuracy
@@ -16,10 +17,10 @@ should probably proofread and complete it, then remove this comment. -->
 # vit-base-brain-mri
-This model is a fine-tuned version of [google/vit-base-patch16-224](https://huggingface.co/google/vit-base-patch16-224) on an unknown dataset.
 It achieves the following results on the evaluation set:
-- Loss: 0.4598
-- Accuracy: 0.8659
 ## Model description

 license: apache-2.0
 base_model: google/vit-base-patch16-224
 tags:
+- image-classification
 - generated_from_trainer
 metrics:
 - accuracy
 # vit-base-brain-mri
+This model is a fine-tuned version of [google/vit-base-patch16-224](https://huggingface.co/google/vit-base-patch16-224) on the BrainMRI dataset.
 It achieves the following results on the evaluation set:
+- Loss: 1.0577
+- Accuracy: 0.5990
 ## Model description

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 15.0,
-    "eval_accuracy": 0.5685279187817259,
-    "eval_loss": 1.129746437072754,
-    "eval_runtime": 3.3762,
-    "eval_samples_per_second": 116.699,
-    "eval_steps_per_second": 14.809,
-    "total_flos": 2.6688719619794534e+18,
-    "train_loss": 0.03615495540477611,
-    "train_runtime": 26.3241,
-    "train_samples_per_second": 1308.306,
-    "train_steps_per_second": 41.027
 }

 {
+    "epoch": 20.0,
+    "eval_accuracy": 0.5989847715736041,
+    "eval_loss": 1.057724118232727,
+    "eval_runtime": 3.0042,
+    "eval_samples_per_second": 131.149,
+    "eval_steps_per_second": 16.643,
+    "total_flos": 3.558495949305938e+18,
+    "train_loss": 0.5529726452297634,
+    "train_runtime": 477.7876,
+    "train_samples_per_second": 96.11,
+    "train_steps_per_second": 3.014
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 15.0,
-    "eval_accuracy": 0.5685279187817259,
-    "eval_loss": 1.129746437072754,
-    "eval_runtime": 3.3762,
-    "eval_samples_per_second": 116.699,
-    "eval_steps_per_second": 14.809
 }

 {
+    "epoch": 20.0,
+    "eval_accuracy": 0.5989847715736041,
+    "eval_loss": 1.057724118232727,
+    "eval_runtime": 3.0042,
+    "eval_samples_per_second": 131.149,
+    "eval_steps_per_second": 16.643
 }

runs/Aug28_15-52-04_DESKTOP-4SGMSGR/events.out.tfevents.1724850055.DESKTOP-4SGMSGR.2900.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:07bee8e181d6479e4cf7e652479306ddba587305125fc051df3ecc3a2351f532
+size 363

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 15.0,
-    "total_flos": 2.6688719619794534e+18,
-    "train_loss": 0.03615495540477611,
-    "train_runtime": 26.3241,
-    "train_samples_per_second": 1308.306,
-    "train_steps_per_second": 41.027
 }

 {
+    "epoch": 20.0,
+    "total_flos": 3.558495949305938e+18,
+    "train_loss": 0.5529726452297634,
+    "train_runtime": 477.7876,
+    "train_samples_per_second": 96.11,
+    "train_steps_per_second": 3.014
 }

trainer_state.json CHANGED Viewed

@@ -1,232 +1,305 @@
 {
-  "best_metric": 0.5857352614402771,
-  "best_model_checkpoint": "./vit-base-brain-mri\\checkpoint-1008",
-  "epoch": 15.0,
   "eval_steps": 500,
-  "global_step": 1080,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
-      "eval_accuracy": 0.6289198606271778,
-      "eval_loss": 0.9818006753921509,
-      "eval_runtime": 4.8676,
-      "eval_samples_per_second": 117.922,
-      "eval_steps_per_second": 14.792,
       "step": 72
     },
     {
       "epoch": 1.3888888888888888,
-      "grad_norm": 2.2408666610717773,
-      "learning_rate": 0.00021666666666666666,
-      "loss": 1.0744,
       "step": 100
     },
     {
       "epoch": 2.0,
-      "eval_accuracy": 0.686411149825784,
-      "eval_loss": 0.8286930322647095,
-      "eval_runtime": 4.7946,
-      "eval_samples_per_second": 119.718,
-      "eval_steps_per_second": 15.017,
       "step": 144
     },
     {
       "epoch": 2.7777777777777777,
-      "grad_norm": 4.1483378410339355,
-      "learning_rate": 0.0001333333333333333,
-      "loss": 0.7716,
       "step": 200
     },
     {
       "epoch": 3.0,
-      "eval_accuracy": 0.7160278745644599,
-      "eval_loss": 0.7534749507904053,
-      "eval_runtime": 4.9187,
-      "eval_samples_per_second": 116.696,
-      "eval_steps_per_second": 14.638,
       "step": 216
     },
     {
       "epoch": 4.0,
-      "eval_accuracy": 0.740418118466899,
-      "eval_loss": 0.7139923572540283,
-      "eval_runtime": 4.8084,
-      "eval_samples_per_second": 119.374,
-      "eval_steps_per_second": 14.974,
       "step": 288
     },
     {
       "epoch": 4.166666666666667,
-      "grad_norm": 3.2614974975585938,
-      "learning_rate": 4.9999999999999996e-05,
-      "loss": 0.6975,
       "step": 300
     },
     {
       "epoch": 5.0,
-      "eval_accuracy": 0.7491289198606271,
-      "eval_loss": 0.7015281915664673,
-      "eval_runtime": 4.8073,
-      "eval_samples_per_second": 119.403,
-      "eval_steps_per_second": 14.977,
       "step": 360
     },
     {
       "epoch": 5.555555555555555,
-      "grad_norm": 1.9345481395721436,
-      "learning_rate": 0.0001333333333333333,
-      "loss": 0.6651,
       "step": 400
     },
     {
       "epoch": 6.0,
-      "eval_accuracy": 0.7630662020905923,
-      "eval_loss": 0.68391352891922,
-      "eval_runtime": 4.8866,
-      "eval_samples_per_second": 117.465,
-      "eval_steps_per_second": 14.734,
       "step": 432
     },
     {
       "epoch": 6.944444444444445,
-      "grad_norm": 2.201732635498047,
-      "learning_rate": 9.166666666666667e-05,
-      "loss": 0.6307,
       "step": 500
     },
     {
       "epoch": 7.0,
-      "eval_accuracy": 0.7700348432055749,
-      "eval_loss": 0.6623685359954834,
-      "eval_runtime": 4.9432,
-      "eval_samples_per_second": 116.118,
-      "eval_steps_per_second": 14.565,
       "step": 504
     },
     {
       "epoch": 8.0,
-      "eval_accuracy": 0.7822299651567944,
-      "eval_loss": 0.6363218426704407,
-      "eval_runtime": 4.9241,
-      "eval_samples_per_second": 116.57,
-      "eval_steps_per_second": 14.622,
       "step": 576
     },
     {
       "epoch": 8.333333333333334,
-      "grad_norm": 1.8554637432098389,
-      "learning_rate": 4.9999999999999996e-05,
-      "loss": 0.5857,
       "step": 600
     },
     {
       "epoch": 9.0,
-      "eval_accuracy": 0.7822299651567944,
-      "eval_loss": 0.6089015603065491,
-      "eval_runtime": 4.9259,
-      "eval_samples_per_second": 116.527,
-      "eval_steps_per_second": 14.617,
       "step": 648
     },
     {
       "epoch": 9.722222222222221,
-      "grad_norm": 3.4061734676361084,
-      "learning_rate": 8.333333333333332e-06,
-      "loss": 0.576,
       "step": 700
     },
     {
       "epoch": 10.0,
-      "eval_accuracy": 0.7770034843205574,
-      "eval_loss": 0.6249111294746399,
-      "eval_runtime": 5.1184,
-      "eval_samples_per_second": 112.144,
-      "eval_steps_per_second": 14.067,
       "step": 720
     },
     {
       "epoch": 11.0,
-      "eval_accuracy": 0.7839721254355401,
-      "eval_loss": 0.6184366941452026,
-      "eval_runtime": 4.8681,
-      "eval_samples_per_second": 117.91,
-      "eval_steps_per_second": 14.79,
       "step": 792
     },
     {
       "epoch": 11.11111111111111,
-      "grad_norm": 2.4091649055480957,
-      "learning_rate": 6.190476190476189e-05,
-      "loss": 0.5733,
       "step": 800
     },
     {
       "epoch": 12.0,
-      "eval_accuracy": 0.794425087108014,
-      "eval_loss": 0.6006320714950562,
-      "eval_runtime": 4.8997,
-      "eval_samples_per_second": 117.151,
-      "eval_steps_per_second": 14.695,
       "step": 864
     },
     {
       "epoch": 12.5,
-      "grad_norm": 2.6921584606170654,
-      "learning_rate": 3.214285714285714e-05,
-      "loss": 0.5555,
       "step": 900
     },
     {
       "epoch": 13.0,
-      "eval_accuracy": 0.8013937282229965,
-      "eval_loss": 0.5897805690765381,
-      "eval_runtime": 4.8766,
-      "eval_samples_per_second": 117.705,
-      "eval_steps_per_second": 14.764,
       "step": 936
     },
     {
       "epoch": 13.88888888888889,
-      "grad_norm": 1.2396776676177979,
-      "learning_rate": 2.3809523809523808e-06,
-      "loss": 0.5481,
       "step": 1000
     },
     {
       "epoch": 14.0,
-      "eval_accuracy": 0.8222996515679443,
-      "eval_loss": 0.5857352614402771,
-      "eval_runtime": 4.9368,
-      "eval_samples_per_second": 116.27,
-      "eval_steps_per_second": 14.584,
       "step": 1008
     },
     {
       "epoch": 15.0,
-      "eval_accuracy": 0.7857142857142857,
-      "eval_loss": 0.5991856455802917,
-      "eval_runtime": 5.1206,
-      "eval_samples_per_second": 112.096,
-      "eval_steps_per_second": 14.061,
       "step": 1080
     },
     {
-      "epoch": 15.0,
-      "step": 1080,
-      "total_flos": 2.6688719619794534e+18,
-      "train_loss": 0.03615495540477611,
-      "train_runtime": 26.3241,
-      "train_samples_per_second": 1308.306,
-      "train_steps_per_second": 41.027
     }
   ],
   "logging_steps": 100,
-  "max_steps": 1080,
   "num_input_tokens_seen": 0,
-  "num_train_epochs": 15,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
@@ -240,7 +313,7 @@
       "attributes": {}
     }
   },
-  "total_flos": 2.6688719619794534e+18,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null

 {
+  "best_metric": 0.4597996771335602,
+  "best_model_checkpoint": "./vit-base-brain-mri\\checkpoint-1440",
+  "epoch": 20.0,
   "eval_steps": 500,
+  "global_step": 1440,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
       "epoch": 1.0,
+      "eval_accuracy": 0.6097560975609756,
+      "eval_loss": 0.998555600643158,
+      "eval_runtime": 4.892,
+      "eval_samples_per_second": 117.334,
+      "eval_steps_per_second": 14.718,
       "step": 72
     },
     {
       "epoch": 1.3888888888888888,
+      "grad_norm": 2.622373342514038,
+      "learning_rate": 0.00027916666666666666,
+      "loss": 1.098,
       "step": 100
     },
     {
       "epoch": 2.0,
+      "eval_accuracy": 0.7003484320557491,
+      "eval_loss": 0.8445045948028564,
+      "eval_runtime": 4.8929,
+      "eval_samples_per_second": 117.312,
+      "eval_steps_per_second": 14.715,
       "step": 144
     },
     {
       "epoch": 2.7777777777777777,
+      "grad_norm": 4.336460590362549,
+      "learning_rate": 0.00025833333333333334,
+      "loss": 0.7895,
       "step": 200
     },
     {
       "epoch": 3.0,
+      "eval_accuracy": 0.7526132404181185,
+      "eval_loss": 0.7317853569984436,
+      "eval_runtime": 4.7479,
+      "eval_samples_per_second": 120.896,
+      "eval_steps_per_second": 15.165,
       "step": 216
     },
     {
       "epoch": 4.0,
+      "eval_accuracy": 0.7473867595818815,
+      "eval_loss": 0.6842443943023682,
+      "eval_runtime": 4.5716,
+      "eval_samples_per_second": 125.558,
+      "eval_steps_per_second": 15.749,
       "step": 288
     },
     {
       "epoch": 4.166666666666667,
+      "grad_norm": 3.367997169494629,
+      "learning_rate": 0.00023749999999999997,
+      "loss": 0.6629,
       "step": 300
     },
     {
       "epoch": 5.0,
+      "eval_accuracy": 0.7857142857142857,
+      "eval_loss": 0.6328176856040955,
+      "eval_runtime": 4.5619,
+      "eval_samples_per_second": 125.825,
+      "eval_steps_per_second": 15.783,
       "step": 360
     },
     {
       "epoch": 5.555555555555555,
+      "grad_norm": 2.0712759494781494,
+      "learning_rate": 0.00021666666666666666,
+      "loss": 0.5966,
       "step": 400
     },
     {
       "epoch": 6.0,
+      "eval_accuracy": 0.8101045296167247,
+      "eval_loss": 0.5956693291664124,
+      "eval_runtime": 4.6073,
+      "eval_samples_per_second": 124.585,
+      "eval_steps_per_second": 15.627,
       "step": 432
     },
     {
       "epoch": 6.944444444444445,
+      "grad_norm": 1.491408348083496,
+      "learning_rate": 0.00019583333333333331,
+      "loss": 0.5546,
       "step": 500
     },
     {
       "epoch": 7.0,
+      "eval_accuracy": 0.8118466898954704,
+      "eval_loss": 0.5646191835403442,
+      "eval_runtime": 4.5982,
+      "eval_samples_per_second": 124.83,
+      "eval_steps_per_second": 15.658,
       "step": 504
     },
     {
       "epoch": 8.0,
+      "eval_accuracy": 0.8048780487804879,
+      "eval_loss": 0.5646994709968567,
+      "eval_runtime": 4.6362,
+      "eval_samples_per_second": 123.809,
+      "eval_steps_per_second": 15.53,
       "step": 576
     },
     {
       "epoch": 8.333333333333334,
+      "grad_norm": 1.5481159687042236,
+      "learning_rate": 0.000175,
+      "loss": 0.5113,
       "step": 600
     },
     {
       "epoch": 9.0,
+      "eval_accuracy": 0.8275261324041812,
+      "eval_loss": 0.5340307354927063,
+      "eval_runtime": 4.6122,
+      "eval_samples_per_second": 124.453,
+      "eval_steps_per_second": 15.611,
       "step": 648
     },
     {
       "epoch": 9.722222222222221,
+      "grad_norm": 2.323460817337036,
+      "learning_rate": 0.00015416666666666663,
+      "loss": 0.4882,
       "step": 700
     },
     {
       "epoch": 10.0,
+      "eval_accuracy": 0.8327526132404182,
+      "eval_loss": 0.5189912915229797,
+      "eval_runtime": 4.6128,
+      "eval_samples_per_second": 124.435,
+      "eval_steps_per_second": 15.609,
       "step": 720
     },
     {
       "epoch": 11.0,
+      "eval_accuracy": 0.8327526132404182,
+      "eval_loss": 0.5197045803070068,
+      "eval_runtime": 4.6509,
+      "eval_samples_per_second": 123.417,
+      "eval_steps_per_second": 15.481,
       "step": 792
     },
     {
       "epoch": 11.11111111111111,
+      "grad_norm": 2.1213157176971436,
+      "learning_rate": 0.0001333333333333333,
+      "loss": 0.4789,
       "step": 800
     },
     {
       "epoch": 12.0,
+      "eval_accuracy": 0.8257839721254355,
+      "eval_loss": 0.5001842975616455,
+      "eval_runtime": 4.5564,
+      "eval_samples_per_second": 125.977,
+      "eval_steps_per_second": 15.802,
       "step": 864
     },
     {
       "epoch": 12.5,
+      "grad_norm": 1.9881811141967773,
+      "learning_rate": 0.0001125,
+      "loss": 0.4582,
       "step": 900
     },
     {
       "epoch": 13.0,
+      "eval_accuracy": 0.8310104529616724,
+      "eval_loss": 0.4956616163253784,
+      "eval_runtime": 4.5548,
+      "eval_samples_per_second": 126.02,
+      "eval_steps_per_second": 15.807,
       "step": 936
     },
     {
       "epoch": 13.88888888888889,
+      "grad_norm": 2.0128438472747803,
+      "learning_rate": 9.166666666666667e-05,
+      "loss": 0.4426,
       "step": 1000
     },
     {
       "epoch": 14.0,
+      "eval_accuracy": 0.8310104529616724,
+      "eval_loss": 0.4820682108402252,
+      "eval_runtime": 4.6027,
+      "eval_samples_per_second": 124.708,
+      "eval_steps_per_second": 15.643,
       "step": 1008
     },
     {
       "epoch": 15.0,
+      "eval_accuracy": 0.8466898954703833,
+      "eval_loss": 0.4706496000289917,
+      "eval_runtime": 4.5952,
+      "eval_samples_per_second": 124.913,
+      "eval_steps_per_second": 15.669,
       "step": 1080
     },
     {
+      "epoch": 15.277777777777779,
+      "grad_norm": 1.9610830545425415,
+      "learning_rate": 7.083333333333332e-05,
+      "loss": 0.4328,
+      "step": 1100
+    },
+    {
+      "epoch": 16.0,
+      "eval_accuracy": 0.8153310104529616,
+      "eval_loss": 0.4820646047592163,
+      "eval_runtime": 4.6291,
+      "eval_samples_per_second": 123.999,
+      "eval_steps_per_second": 15.554,
+      "step": 1152
+    },
+    {
+      "epoch": 16.666666666666668,
+      "grad_norm": 1.850261926651001,
+      "learning_rate": 4.9999999999999996e-05,
+      "loss": 0.432,
+      "step": 1200
+    },
+    {
+      "epoch": 17.0,
+      "eval_accuracy": 0.8275261324041812,
+      "eval_loss": 0.4991794228553772,
+      "eval_runtime": 4.5987,
+      "eval_samples_per_second": 124.818,
+      "eval_steps_per_second": 15.657,
+      "step": 1224
+    },
+    {
+      "epoch": 18.0,
+      "eval_accuracy": 0.8344947735191638,
+      "eval_loss": 0.4799434542655945,
+      "eval_runtime": 4.621,
+      "eval_samples_per_second": 124.216,
+      "eval_steps_per_second": 15.581,
+      "step": 1296
+    },
+    {
+      "epoch": 18.055555555555557,
+      "grad_norm": 1.6390336751937866,
+      "learning_rate": 2.9166666666666663e-05,
+      "loss": 0.4196,
+      "step": 1300
+    },
+    {
+      "epoch": 19.0,
+      "eval_accuracy": 0.8310104529616724,
+      "eval_loss": 0.4837837815284729,
+      "eval_runtime": 4.5576,
+      "eval_samples_per_second": 125.943,
+      "eval_steps_per_second": 15.798,
+      "step": 1368
+    },
+    {
+      "epoch": 19.444444444444443,
+      "grad_norm": 3.292024612426758,
+      "learning_rate": 8.333333333333332e-06,
+      "loss": 0.4287,
+      "step": 1400
+    },
+    {
+      "epoch": 20.0,
+      "eval_accuracy": 0.8658536585365854,
+      "eval_loss": 0.4597996771335602,
+      "eval_runtime": 4.6098,
+      "eval_samples_per_second": 124.517,
+      "eval_steps_per_second": 15.619,
+      "step": 1440
+    },
+    {
+      "epoch": 20.0,
+      "step": 1440,
+      "total_flos": 3.558495949305938e+18,
+      "train_loss": 0.5529726452297634,
+      "train_runtime": 477.7876,
+      "train_samples_per_second": 96.11,
+      "train_steps_per_second": 3.014
     }
   ],
   "logging_steps": 100,
+  "max_steps": 1440,
   "num_input_tokens_seen": 0,
+  "num_train_epochs": 20,
   "save_steps": 500,
   "stateful_callbacks": {
     "TrainerControl": {
       "attributes": {}
     }
   },
+  "total_flos": 3.558495949305938e+18,
   "train_batch_size": 32,
   "trial_name": null,
   "trial_params": null