End of training

Browse files

Files changed (5) hide show

all_results.json +11 -11
eval_results.json +6 -6
runs/May08_13-23-35_1ed587541f1e/events.out.tfevents.1683555751.1ed587541f1e.1694.2 +3 -0
train_results.json +6 -6
trainer_state.json +269 -680

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
-    "epoch": 9.94,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.002956948010250926,
-    "eval_runtime": 23.6672,
-    "eval_samples_per_second": 34.943,
-    "eval_steps_per_second": 4.394,
-    "total_flos": 1.8367349154946929e+18,
-    "train_loss": 0.10741477019407532,
-    "train_runtime": 3799.865,
-    "train_samples_per_second": 19.572,
-    "train_steps_per_second": 0.347
 }

 {
+    "epoch": 4.97,
+    "eval_accuracy": 0.9966480446927374,
+    "eval_loss": 0.010998690500855446,
+    "eval_runtime": 22.8893,
+    "eval_samples_per_second": 39.101,
+    "eval_steps_per_second": 4.893,
+    "total_flos": 9.948639012864492e+17,
+    "train_loss": 0.1435624466075764,
+    "train_runtime": 3458.6134,
+    "train_samples_per_second": 11.641,
+    "train_steps_per_second": 0.207
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 9.94,
-    "eval_accuracy": 1.0,
-    "eval_loss": 0.002956948010250926,
-    "eval_runtime": 23.6672,
-    "eval_samples_per_second": 34.943,
-    "eval_steps_per_second": 4.394
 }

 {
+    "epoch": 4.97,
+    "eval_accuracy": 0.9966480446927374,
+    "eval_loss": 0.010998690500855446,
+    "eval_runtime": 22.8893,
+    "eval_samples_per_second": 39.101,
+    "eval_steps_per_second": 4.893
 }

runs/May08_13-23-35_1ed587541f1e/events.out.tfevents.1683555751.1ed587541f1e.1694.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:e324b03b56b1c7f5de352453b1d85c489c1b01fbd171289a65f020ed20267f00
+size 411

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
-    "epoch": 9.94,
-    "total_flos": 1.8367349154946929e+18,
-    "train_loss": 0.10741477019407532,
-    "train_runtime": 3799.865,
-    "train_samples_per_second": 19.572,
-    "train_steps_per_second": 0.347
 }

 {
+    "epoch": 4.97,
+    "total_flos": 9.948639012864492e+17,
+    "train_loss": 0.1435624466075764,
+    "train_runtime": 3458.6134,
+    "train_samples_per_second": 11.641,
+    "train_steps_per_second": 0.207
 }

trainer_state.json CHANGED Viewed

@@ -1,907 +1,496 @@
 {
-  "best_metric": 1.0,
-  "best_model_checkpoint": "swin-tiny-patch4-window7-224-LongSleeveCleanedData/checkpoint-930",
-  "epoch": 9.935483870967742,
-  "global_step": 1320,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
-      "epoch": 0.08,
-      "learning_rate": 3.571428571428572e-05,
-      "loss": 1.0666,
       "step": 10
     },
     {
-      "epoch": 0.15,
-      "learning_rate": 4.9770290964777946e-05,
-      "loss": 0.7487,
       "step": 20
     },
     {
-      "epoch": 0.23,
-      "learning_rate": 4.93874425727412e-05,
-      "loss": 0.481,
       "step": 30
     },
     {
-      "epoch": 0.3,
-      "learning_rate": 4.900459418070444e-05,
-      "loss": 0.351,
       "step": 40
     },
     {
-      "epoch": 0.38,
-      "learning_rate": 4.862174578866769e-05,
-      "loss": 0.2594,
       "step": 50
     },
     {
-      "epoch": 0.45,
-      "learning_rate": 4.823889739663094e-05,
-      "loss": 0.3307,
       "step": 60
     },
     {
-      "epoch": 0.53,
-      "learning_rate": 4.785604900459418e-05,
-      "loss": 0.2245,
       "step": 70
     },
     {
-      "epoch": 0.6,
-      "learning_rate": 4.747320061255743e-05,
-      "loss": 0.1778,
       "step": 80
     },
     {
-      "epoch": 0.68,
-      "learning_rate": 4.709035222052068e-05,
-      "loss": 0.216,
       "step": 90
     },
     {
-      "epoch": 0.75,
-      "learning_rate": 4.670750382848392e-05,
-      "loss": 0.1601,
       "step": 100
     },
     {
-      "epoch": 0.83,
-      "learning_rate": 4.632465543644717e-05,
-      "loss": 0.2145,
       "step": 110
     },
     {
-      "epoch": 0.9,
-      "learning_rate": 4.594180704441042e-05,
-      "loss": 0.2227,
       "step": 120
     },
     {
-      "epoch": 0.98,
-      "learning_rate": 4.555895865237366e-05,
-      "loss": 0.1472,
       "step": 130
     },
     {
-      "epoch": 0.99,
-      "eval_accuracy": 0.9830713422007256,
-      "eval_loss": 0.04599744826555252,
-      "eval_runtime": 128.5076,
-      "eval_samples_per_second": 6.435,
-      "eval_steps_per_second": 0.809,
-      "step": 132
     },
     {
-      "epoch": 1.05,
-      "learning_rate": 4.517611026033691e-05,
-      "loss": 0.1663,
-      "step": 140
     },
     {
-      "epoch": 1.13,
-      "learning_rate": 4.479326186830016e-05,
-      "loss": 0.1108,
       "step": 150
     },
     {
-      "epoch": 1.2,
-      "learning_rate": 4.4410413476263404e-05,
-      "loss": 0.1293,
       "step": 160
     },
     {
-      "epoch": 1.28,
-      "learning_rate": 4.402756508422665e-05,
-      "loss": 0.1695,
       "step": 170
     },
     {
-      "epoch": 1.35,
-      "learning_rate": 4.36447166921899e-05,
-      "loss": 0.1437,
       "step": 180
     },
     {
-      "epoch": 1.43,
-      "learning_rate": 4.3261868300153144e-05,
-      "loss": 0.1342,
       "step": 190
     },
     {
-      "epoch": 1.51,
-      "learning_rate": 4.287901990811639e-05,
-      "loss": 0.1243,
       "step": 200
     },
     {
-      "epoch": 1.58,
-      "learning_rate": 4.249617151607963e-05,
-      "loss": 0.1295,
       "step": 210
     },
     {
-      "epoch": 1.66,
-      "learning_rate": 4.211332312404288e-05,
-      "loss": 0.1061,
       "step": 220
     },
     {
-      "epoch": 1.73,
-      "learning_rate": 4.173047473200612e-05,
-      "loss": 0.1433,
       "step": 230
     },
     {
-      "epoch": 1.81,
-      "learning_rate": 4.1347626339969374e-05,
-      "loss": 0.167,
       "step": 240
     },
     {
-      "epoch": 1.88,
-      "learning_rate": 4.096477794793262e-05,
-      "loss": 0.0885,
       "step": 250
     },
     {
-      "epoch": 1.96,
-      "learning_rate": 4.058192955589586e-05,
-      "loss": 0.1171,
       "step": 260
     },
     {
-      "epoch": 1.99,
-      "eval_accuracy": 0.9903264812575574,
-      "eval_loss": 0.021295879036188126,
-      "eval_runtime": 22.6767,
-      "eval_samples_per_second": 36.469,
-      "eval_steps_per_second": 4.586,
-      "step": 265
-    },
-    {
-      "epoch": 2.03,
-      "learning_rate": 4.0199081163859114e-05,
-      "loss": 0.1212,
       "step": 270
     },
     {
-      "epoch": 2.11,
-      "learning_rate": 3.981623277182236e-05,
-      "loss": 0.0869,
       "step": 280
     },
     {
-      "epoch": 2.18,
-      "learning_rate": 3.943338437978561e-05,
-      "loss": 0.106,
       "step": 290
     },
     {
-      "epoch": 2.26,
-      "learning_rate": 3.9050535987748854e-05,
-      "loss": 0.1024,
       "step": 300
     },
     {
-      "epoch": 2.33,
-      "learning_rate": 3.86676875957121e-05,
-      "loss": 0.1124,
       "step": 310
     },
     {
-      "epoch": 2.41,
-      "learning_rate": 3.828483920367535e-05,
-      "loss": 0.0942,
       "step": 320
     },
     {
-      "epoch": 2.48,
-      "learning_rate": 3.7901990811638595e-05,
-      "loss": 0.1147,
       "step": 330
     },
     {
-      "epoch": 2.56,
-      "learning_rate": 3.751914241960184e-05,
-      "loss": 0.0974,
       "step": 340
     },
     {
-      "epoch": 2.63,
-      "learning_rate": 3.713629402756509e-05,
-      "loss": 0.0877,
       "step": 350
     },
     {
-      "epoch": 2.71,
-      "learning_rate": 3.6753445635528335e-05,
-      "loss": 0.093,
       "step": 360
     },
     {
-      "epoch": 2.78,
-      "learning_rate": 3.637059724349158e-05,
-      "loss": 0.0815,
       "step": 370
     },
     {
-      "epoch": 2.86,
-      "learning_rate": 3.598774885145483e-05,
-      "loss": 0.083,
       "step": 380
     },
     {
-      "epoch": 2.94,
-      "learning_rate": 3.5604900459418075e-05,
-      "loss": 0.133,
       "step": 390
     },
     {
-      "epoch": 3.0,
-      "eval_accuracy": 0.9975816203143894,
-      "eval_loss": 0.007586946245282888,
-      "eval_runtime": 21.2686,
-      "eval_samples_per_second": 38.884,
-      "eval_steps_per_second": 4.89,
-      "step": 398
-    },
-    {
-      "epoch": 3.01,
-      "learning_rate": 3.522205206738132e-05,
-      "loss": 0.1194,
       "step": 400
     },
     {
-      "epoch": 3.09,
-      "learning_rate": 3.4839203675344565e-05,
-      "loss": 0.076,
       "step": 410
     },
     {
-      "epoch": 3.16,
-      "learning_rate": 3.445635528330781e-05,
-      "loss": 0.1054,
       "step": 420
     },
     {
-      "epoch": 3.24,
-      "learning_rate": 3.4073506891271054e-05,
-      "loss": 0.1116,
       "step": 430
     },
     {
-      "epoch": 3.31,
-      "learning_rate": 3.3690658499234305e-05,
-      "loss": 0.0979,
       "step": 440
     },
     {
-      "epoch": 3.39,
-      "learning_rate": 3.330781010719755e-05,
-      "loss": 0.0656,
       "step": 450
     },
     {
-      "epoch": 3.46,
-      "learning_rate": 3.2924961715160794e-05,
-      "loss": 0.0599,
       "step": 460
     },
     {
-      "epoch": 3.54,
-      "learning_rate": 3.2542113323124045e-05,
-      "loss": 0.0693,
       "step": 470
     },
     {
-      "epoch": 3.61,
-      "learning_rate": 3.215926493108729e-05,
-      "loss": 0.1082,
       "step": 480
     },
     {
-      "epoch": 3.69,
-      "learning_rate": 3.1776416539050534e-05,
-      "loss": 0.0696,
       "step": 490
     },
     {
-      "epoch": 3.76,
-      "learning_rate": 3.1393568147013786e-05,
-      "loss": 0.0656,
       "step": 500
     },
     {
-      "epoch": 3.84,
-      "learning_rate": 3.101071975497703e-05,
-      "loss": 0.0767,
       "step": 510
     },
     {
-      "epoch": 3.91,
-      "learning_rate": 3.0627871362940275e-05,
-      "loss": 0.1195,
       "step": 520
     },
     {
-      "epoch": 3.99,
-      "learning_rate": 3.0245022970903526e-05,
-      "loss": 0.0714,
       "step": 530
     },
     {
-      "epoch": 4.0,
-      "eval_accuracy": 0.9975816203143894,
-      "eval_loss": 0.008087977766990662,
-      "eval_runtime": 23.253,
-      "eval_samples_per_second": 35.565,
-      "eval_steps_per_second": 4.473,
-      "step": 531
-    },
-    {
-      "epoch": 4.06,
-      "learning_rate": 2.986217457886677e-05,
-      "loss": 0.1059,
       "step": 540
     },
     {
-      "epoch": 4.14,
-      "learning_rate": 2.9479326186830015e-05,
-      "loss": 0.0458,
       "step": 550
     },
     {
-      "epoch": 4.22,
-      "learning_rate": 2.9096477794793263e-05,
-      "loss": 0.0657,
       "step": 560
     },
     {
-      "epoch": 4.29,
-      "learning_rate": 2.8713629402756508e-05,
-      "loss": 0.1046,
       "step": 570
     },
     {
-      "epoch": 4.37,
-      "learning_rate": 2.833078101071976e-05,
-      "loss": 0.0963,
       "step": 580
     },
     {
-      "epoch": 4.44,
-      "learning_rate": 2.7947932618683003e-05,
-      "loss": 0.0883,
       "step": 590
     },
     {
-      "epoch": 4.52,
-      "learning_rate": 2.7565084226646248e-05,
-      "loss": 0.0713,
       "step": 600
     },
     {
-      "epoch": 4.59,
-      "learning_rate": 2.71822358346095e-05,
-      "loss": 0.1307,
       "step": 610
     },
     {
-      "epoch": 4.67,
-      "learning_rate": 2.6799387442572744e-05,
-      "loss": 0.0879,
       "step": 620
     },
     {
-      "epoch": 4.74,
-      "learning_rate": 2.6416539050535988e-05,
-      "loss": 0.1203,
       "step": 630
     },
     {
-      "epoch": 4.82,
-      "learning_rate": 2.603369065849924e-05,
-      "loss": 0.0743,
       "step": 640
     },
     {
-      "epoch": 4.89,
-      "learning_rate": 2.5650842266462484e-05,
-      "loss": 0.0842,
       "step": 650
     },
     {
-      "epoch": 4.97,
-      "learning_rate": 2.526799387442573e-05,
-      "loss": 0.0776,
       "step": 660
     },
     {
-      "epoch": 5.0,
-      "eval_accuracy": 0.9987908101571947,
-      "eval_loss": 0.005263020750135183,
-      "eval_runtime": 23.3335,
-      "eval_samples_per_second": 35.443,
-      "eval_steps_per_second": 4.457,
-      "step": 664
-    },
-    {
-      "epoch": 5.04,
-      "learning_rate": 2.4885145482388973e-05,
-      "loss": 0.1302,
       "step": 670
     },
     {
-      "epoch": 5.12,
-      "learning_rate": 2.450229709035222e-05,
-      "loss": 0.0708,
       "step": 680
     },
     {
-      "epoch": 5.19,
-      "learning_rate": 2.411944869831547e-05,
-      "loss": 0.0717,
       "step": 690
     },
     {
-      "epoch": 5.27,
-      "learning_rate": 2.3736600306278714e-05,
-      "loss": 0.0932,
       "step": 700
     },
     {
-      "epoch": 5.34,
-      "learning_rate": 2.335375191424196e-05,
-      "loss": 0.0895,
       "step": 710
     },
     {
-      "epoch": 5.42,
-      "learning_rate": 2.297090352220521e-05,
-      "loss": 0.0572,
-      "step": 720
-    },
-    {
-      "epoch": 5.49,
-      "learning_rate": 2.2588055130168454e-05,
-      "loss": 0.0798,
-      "step": 730
-    },
-    {
-      "epoch": 5.57,
-      "learning_rate": 2.2205206738131702e-05,
-      "loss": 0.0588,
-      "step": 740
-    },
-    {
-      "epoch": 5.65,
-      "learning_rate": 2.182235834609495e-05,
-      "loss": 0.0785,
-      "step": 750
-    },
-    {
-      "epoch": 5.72,
-      "learning_rate": 2.1439509954058194e-05,
-      "loss": 0.0803,
-      "step": 760
-    },
-    {
-      "epoch": 5.8,
-      "learning_rate": 2.105666156202144e-05,
-      "loss": 0.0648,
-      "step": 770
-    },
-    {
-      "epoch": 5.87,
-      "learning_rate": 2.0673813169984687e-05,
-      "loss": 0.0589,
-      "step": 780
-    },
-    {
-      "epoch": 5.95,
-      "learning_rate": 2.029096477794793e-05,
-      "loss": 0.0812,
-      "step": 790
-    },
-    {
-      "epoch": 6.0,
-      "eval_accuracy": 0.9975816203143894,
-      "eval_loss": 0.004879950545728207,
-      "eval_runtime": 22.7765,
-      "eval_samples_per_second": 36.309,
-      "eval_steps_per_second": 4.566,
-      "step": 797
-    },
-    {
-      "epoch": 6.02,
-      "learning_rate": 1.990811638591118e-05,
-      "loss": 0.0705,
-      "step": 800
-    },
-    {
-      "epoch": 6.1,
-      "learning_rate": 1.9525267993874427e-05,
-      "loss": 0.0651,
-      "step": 810
-    },
-    {
-      "epoch": 6.17,
-      "learning_rate": 1.9142419601837675e-05,
-      "loss": 0.0941,
-      "step": 820
-    },
-    {
-      "epoch": 6.25,
-      "learning_rate": 1.875957120980092e-05,
-      "loss": 0.0627,
-      "step": 830
-    },
-    {
-      "epoch": 6.32,
-      "learning_rate": 1.8376722817764168e-05,
-      "loss": 0.0868,
-      "step": 840
-    },
-    {
-      "epoch": 6.4,
-      "learning_rate": 1.7993874425727415e-05,
-      "loss": 0.066,
-      "step": 850
-    },
-    {
-      "epoch": 6.47,
-      "learning_rate": 1.761102603369066e-05,
-      "loss": 0.0453,
-      "step": 860
-    },
-    {
-      "epoch": 6.55,
-      "learning_rate": 1.7228177641653905e-05,
-      "loss": 0.0536,
-      "step": 870
-    },
-    {
-      "epoch": 6.62,
-      "learning_rate": 1.6845329249617152e-05,
-      "loss": 0.0723,
-      "step": 880
-    },
-    {
-      "epoch": 6.7,
-      "learning_rate": 1.6462480857580397e-05,
-      "loss": 0.0321,
-      "step": 890
-    },
-    {
-      "epoch": 6.77,
-      "learning_rate": 1.6079632465543645e-05,
-      "loss": 0.1033,
-      "step": 900
-    },
-    {
-      "epoch": 6.85,
-      "learning_rate": 1.5696784073506893e-05,
-      "loss": 0.0763,
-      "step": 910
-    },
-    {
-      "epoch": 6.92,
-      "learning_rate": 1.5313935681470137e-05,
-      "loss": 0.0601,
-      "step": 920
-    },
-    {
-      "epoch": 7.0,
-      "learning_rate": 1.4931087289433385e-05,
-      "loss": 0.0658,
-      "step": 930
-    },
-    {
-      "epoch": 7.0,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.002956948010250926,
-      "eval_runtime": 22.0999,
-      "eval_samples_per_second": 37.421,
-      "eval_steps_per_second": 4.706,
-      "step": 930
-    },
-    {
-      "epoch": 7.08,
-      "learning_rate": 1.4548238897396632e-05,
-      "loss": 0.0685,
-      "step": 940
-    },
-    {
-      "epoch": 7.15,
-      "learning_rate": 1.416539050535988e-05,
-      "loss": 0.1036,
-      "step": 950
-    },
-    {
-      "epoch": 7.23,
-      "learning_rate": 1.3782542113323124e-05,
-      "loss": 0.0605,
-      "step": 960
-    },
-    {
-      "epoch": 7.3,
-      "learning_rate": 1.3399693721286372e-05,
-      "loss": 0.0671,
-      "step": 970
-    },
-    {
-      "epoch": 7.38,
-      "learning_rate": 1.301684532924962e-05,
-      "loss": 0.0579,
-      "step": 980
-    },
-    {
-      "epoch": 7.45,
-      "learning_rate": 1.2633996937212864e-05,
-      "loss": 0.0456,
-      "step": 990
-    },
-    {
-      "epoch": 7.53,
-      "learning_rate": 1.225114854517611e-05,
-      "loss": 0.0928,
-      "step": 1000
-    },
-    {
-      "epoch": 7.6,
-      "learning_rate": 1.1868300153139357e-05,
-      "loss": 0.0688,
-      "step": 1010
-    },
-    {
-      "epoch": 7.68,
-      "learning_rate": 1.1485451761102605e-05,
-      "loss": 0.0438,
-      "step": 1020
-    },
-    {
-      "epoch": 7.75,
-      "learning_rate": 1.1102603369065851e-05,
-      "loss": 0.0393,
-      "step": 1030
-    },
-    {
-      "epoch": 7.83,
-      "learning_rate": 1.0719754977029097e-05,
-      "loss": 0.074,
-      "step": 1040
-    },
-    {
-      "epoch": 7.9,
-      "learning_rate": 1.0336906584992343e-05,
-      "loss": 0.0597,
-      "step": 1050
-    },
-    {
-      "epoch": 7.98,
-      "learning_rate": 9.95405819295559e-06,
-      "loss": 0.0804,
-      "step": 1060
-    },
-    {
-      "epoch": 7.99,
-      "eval_accuracy": 0.9975816203143894,
-      "eval_loss": 0.0034685195423662663,
-      "eval_runtime": 22.3239,
-      "eval_samples_per_second": 37.045,
-      "eval_steps_per_second": 4.659,
-      "step": 1062
-    },
-    {
-      "epoch": 8.05,
-      "learning_rate": 9.571209800918838e-06,
-      "loss": 0.0558,
-      "step": 1070
-    },
-    {
-      "epoch": 8.13,
-      "learning_rate": 9.188361408882084e-06,
-      "loss": 0.0275,
-      "step": 1080
-    },
-    {
-      "epoch": 8.2,
-      "learning_rate": 8.80551301684533e-06,
-      "loss": 0.0325,
-      "step": 1090
-    },
-    {
-      "epoch": 8.28,
-      "learning_rate": 8.422664624808576e-06,
-      "loss": 0.0652,
-      "step": 1100
-    },
-    {
-      "epoch": 8.35,
-      "learning_rate": 8.039816232771822e-06,
-      "loss": 0.0559,
-      "step": 1110
-    },
-    {
-      "epoch": 8.43,
-      "learning_rate": 7.656967840735069e-06,
-      "loss": 0.0509,
-      "step": 1120
-    },
-    {
-      "epoch": 8.51,
-      "learning_rate": 7.274119448698316e-06,
-      "loss": 0.0698,
-      "step": 1130
-    },
-    {
-      "epoch": 8.58,
-      "learning_rate": 6.891271056661562e-06,
-      "loss": 0.0676,
-      "step": 1140
-    },
-    {
-      "epoch": 8.66,
-      "learning_rate": 6.50842266462481e-06,
-      "loss": 0.0435,
-      "step": 1150
-    },
-    {
-      "epoch": 8.73,
-      "learning_rate": 6.125574272588055e-06,
-      "loss": 0.0535,
-      "step": 1160
-    },
-    {
-      "epoch": 8.81,
-      "learning_rate": 5.742725880551302e-06,
-      "loss": 0.0499,
-      "step": 1170
-    },
-    {
-      "epoch": 8.88,
-      "learning_rate": 5.359877488514549e-06,
-      "loss": 0.0419,
-      "step": 1180
-    },
-    {
-      "epoch": 8.96,
-      "learning_rate": 4.977029096477795e-06,
-      "loss": 0.0508,
-      "step": 1190
-    },
-    {
-      "epoch": 8.99,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.0011118645779788494,
-      "eval_runtime": 22.2701,
-      "eval_samples_per_second": 37.135,
-      "eval_steps_per_second": 4.67,
-      "step": 1195
-    },
-    {
-      "epoch": 9.03,
-      "learning_rate": 4.594180704441042e-06,
-      "loss": 0.054,
-      "step": 1200
-    },
-    {
-      "epoch": 9.11,
-      "learning_rate": 4.211332312404288e-06,
-      "loss": 0.0596,
-      "step": 1210
-    },
-    {
-      "epoch": 9.18,
-      "learning_rate": 3.828483920367534e-06,
-      "loss": 0.0435,
-      "step": 1220
-    },
-    {
-      "epoch": 9.26,
-      "learning_rate": 3.445635528330781e-06,
-      "loss": 0.0677,
-      "step": 1230
-    },
-    {
-      "epoch": 9.33,
-      "learning_rate": 3.0627871362940276e-06,
-      "loss": 0.0548,
-      "step": 1240
-    },
-    {
-      "epoch": 9.41,
-      "learning_rate": 2.6799387442572743e-06,
-      "loss": 0.0587,
-      "step": 1250
-    },
-    {
-      "epoch": 9.48,
-      "learning_rate": 2.297090352220521e-06,
-      "loss": 0.0382,
-      "step": 1260
-    },
-    {
-      "epoch": 9.56,
-      "learning_rate": 1.914241960183767e-06,
-      "loss": 0.0443,
-      "step": 1270
-    },
-    {
-      "epoch": 9.63,
-      "learning_rate": 1.5313935681470138e-06,
-      "loss": 0.0386,
-      "step": 1280
-    },
-    {
-      "epoch": 9.71,
-      "learning_rate": 1.1485451761102605e-06,
-      "loss": 0.0362,
-      "step": 1290
-    },
-    {
-      "epoch": 9.78,
-      "learning_rate": 7.656967840735069e-07,
-      "loss": 0.0478,
-      "step": 1300
-    },
-    {
-      "epoch": 9.86,
-      "learning_rate": 3.8284839203675346e-07,
-      "loss": 0.055,
-      "step": 1310
-    },
-    {
-      "epoch": 9.94,
-      "learning_rate": 0.0,
-      "loss": 0.0725,
-      "step": 1320
-    },
-    {
-      "epoch": 9.94,
-      "eval_accuracy": 1.0,
-      "eval_loss": 0.0010892293648794293,
-      "eval_runtime": 22.2717,
-      "eval_samples_per_second": 37.132,
-      "eval_steps_per_second": 4.67,
-      "step": 1320
     },
     {
-      "epoch": 9.94,
-      "step": 1320,
-      "total_flos": 1.8367349154946929e+18,
-      "train_loss": 0.10741477019407532,
-      "train_runtime": 3799.865,
-      "train_samples_per_second": 19.572,
-      "train_steps_per_second": 0.347
     }
   ],
-  "max_steps": 1320,
-  "num_train_epochs": 10,
-  "total_flos": 1.8367349154946929e+18,
   "trial_name": null,
   "trial_params": null
 }

 {
+  "best_metric": 0.9966480446927374,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-LongSleeveCleanedData/checkpoint-575",
+  "epoch": 4.97020854021847,
+  "global_step": 715,
   "is_hyper_param_search": false,
   "is_local_process_zero": true,
   "is_world_process_zero": true,
   "log_history": [
     {
+      "epoch": 0.07,
+      "learning_rate": 4.985855728429986e-05,
+      "loss": 1.0641,
       "step": 10
     },
     {
+      "epoch": 0.14,
+      "learning_rate": 4.915134370579915e-05,
+      "loss": 0.7318,
       "step": 20
     },
     {
+      "epoch": 0.21,
+      "learning_rate": 4.844413012729845e-05,
+      "loss": 0.4442,
       "step": 30
     },
     {
+      "epoch": 0.28,
+      "learning_rate": 4.773691654879774e-05,
+      "loss": 0.38,
       "step": 40
     },
     {
+      "epoch": 0.35,
+      "learning_rate": 4.702970297029703e-05,
+      "loss": 0.2757,
       "step": 50
     },
     {
+      "epoch": 0.42,
+      "learning_rate": 4.632248939179633e-05,
+      "loss": 0.2418,
       "step": 60
     },
     {
+      "epoch": 0.49,
+      "learning_rate": 4.561527581329561e-05,
+      "loss": 0.2242,
       "step": 70
     },
     {
+      "epoch": 0.56,
+      "learning_rate": 4.490806223479491e-05,
+      "loss": 0.2094,
       "step": 80
     },
     {
+      "epoch": 0.63,
+      "learning_rate": 4.42008486562942e-05,
+      "loss": 0.2175,
       "step": 90
     },
     {
+      "epoch": 0.7,
+      "learning_rate": 4.3493635077793494e-05,
+      "loss": 0.1794,
       "step": 100
     },
     {
+      "epoch": 0.76,
+      "learning_rate": 4.278642149929279e-05,
+      "loss": 0.147,
       "step": 110
     },
     {
+      "epoch": 0.83,
+      "learning_rate": 4.207920792079208e-05,
+      "loss": 0.1538,
       "step": 120
     },
     {
+      "epoch": 0.9,
+      "learning_rate": 4.1371994342291374e-05,
+      "loss": 0.1365,
       "step": 130
     },
     {
+      "epoch": 0.97,
+      "learning_rate": 4.0664780763790665e-05,
+      "loss": 0.1802,
+      "step": 140
     },
     {
+      "epoch": 0.99,
+      "eval_accuracy": 0.9597765363128492,
+      "eval_loss": 0.1150519847869873,
+      "eval_runtime": 220.0966,
+      "eval_samples_per_second": 4.066,
+      "eval_steps_per_second": 0.509,
+      "step": 143
     },
     {
+      "epoch": 1.04,
+      "learning_rate": 3.9957567185289956e-05,
+      "loss": 0.1855,
       "step": 150
     },
     {
+      "epoch": 1.11,
+      "learning_rate": 3.9250353606789254e-05,
+      "loss": 0.1416,
       "step": 160
     },
     {
+      "epoch": 1.18,
+      "learning_rate": 3.8543140028288545e-05,
+      "loss": 0.1621,
       "step": 170
     },
     {
+      "epoch": 1.25,
+      "learning_rate": 3.783592644978784e-05,
+      "loss": 0.1769,
       "step": 180
     },
     {
+      "epoch": 1.32,
+      "learning_rate": 3.712871287128713e-05,
+      "loss": 0.1404,
       "step": 190
     },
     {
+      "epoch": 1.39,
+      "learning_rate": 3.642149929278642e-05,
+      "loss": 0.139,
       "step": 200
     },
     {
+      "epoch": 1.46,
+      "learning_rate": 3.571428571428572e-05,
+      "loss": 0.138,
       "step": 210
     },
     {
+      "epoch": 1.53,
+      "learning_rate": 3.500707213578501e-05,
+      "loss": 0.1705,
       "step": 220
     },
     {
+      "epoch": 1.6,
+      "learning_rate": 3.4299858557284306e-05,
+      "loss": 0.1272,
       "step": 230
     },
     {
+      "epoch": 1.67,
+      "learning_rate": 3.35926449787836e-05,
+      "loss": 0.1326,
       "step": 240
     },
     {
+      "epoch": 1.74,
+      "learning_rate": 3.288543140028288e-05,
+      "loss": 0.1268,
       "step": 250
     },
     {
+      "epoch": 1.81,
+      "learning_rate": 3.217821782178218e-05,
+      "loss": 0.1383,
       "step": 260
     },
     {
+      "epoch": 1.88,
+      "learning_rate": 3.147100424328147e-05,
+      "loss": 0.1043,
       "step": 270
     },
     {
+      "epoch": 1.95,
+      "learning_rate": 3.076379066478077e-05,
+      "loss": 0.0836,
       "step": 280
     },
     {
+      "epoch": 2.0,
+      "eval_accuracy": 0.994413407821229,
+      "eval_loss": 0.020183874294161797,
+      "eval_runtime": 22.3499,
+      "eval_samples_per_second": 40.045,
+      "eval_steps_per_second": 5.011,
+      "step": 287
+    },
+    {
+      "epoch": 2.02,
+      "learning_rate": 3.0056577086280057e-05,
+      "loss": 0.0581,
       "step": 290
     },
     {
+      "epoch": 2.09,
+      "learning_rate": 2.9349363507779348e-05,
+      "loss": 0.1456,
       "step": 300
     },
     {
+      "epoch": 2.15,
+      "learning_rate": 2.8642149929278646e-05,
+      "loss": 0.1157,
       "step": 310
     },
     {
+      "epoch": 2.22,
+      "learning_rate": 2.7934936350777934e-05,
+      "loss": 0.1005,
       "step": 320
     },
     {
+      "epoch": 2.29,
+      "learning_rate": 2.722772277227723e-05,
+      "loss": 0.0868,
       "step": 330
     },
     {
+      "epoch": 2.36,
+      "learning_rate": 2.6520509193776523e-05,
+      "loss": 0.1223,
       "step": 340
     },
     {
+      "epoch": 2.43,
+      "learning_rate": 2.581329561527581e-05,
+      "loss": 0.1164,
       "step": 350
     },
     {
+      "epoch": 2.5,
+      "learning_rate": 2.510608203677511e-05,
+      "loss": 0.081,
       "step": 360
     },
     {
+      "epoch": 2.57,
+      "learning_rate": 2.43988684582744e-05,
+      "loss": 0.076,
       "step": 370
     },
     {
+      "epoch": 2.64,
+      "learning_rate": 2.369165487977369e-05,
+      "loss": 0.0827,
       "step": 380
     },
     {
+      "epoch": 2.71,
+      "learning_rate": 2.2984441301272985e-05,
+      "loss": 0.0734,
       "step": 390
     },
     {
+      "epoch": 2.78,
+      "learning_rate": 2.227722772277228e-05,
+      "loss": 0.1122,
       "step": 400
     },
     {
+      "epoch": 2.85,
+      "learning_rate": 2.157001414427157e-05,
+      "loss": 0.1241,
       "step": 410
     },
     {
+      "epoch": 2.92,
+      "learning_rate": 2.0862800565770862e-05,
+      "loss": 0.1051,
       "step": 420
     },
     {
+      "epoch": 2.99,
+      "learning_rate": 2.0155586987270157e-05,
+      "loss": 0.1186,
       "step": 430
     },
     {
+      "epoch": 3.0,
+      "eval_accuracy": 0.994413407821229,
+      "eval_loss": 0.01652395911514759,
+      "eval_runtime": 23.7611,
+      "eval_samples_per_second": 37.667,
+      "eval_steps_per_second": 4.714,
+      "step": 431
+    },
+    {
+      "epoch": 3.06,
+      "learning_rate": 1.9448373408769448e-05,
+      "loss": 0.0954,
       "step": 440
     },
     {
+      "epoch": 3.13,
+      "learning_rate": 1.8741159830268743e-05,
+      "loss": 0.066,
       "step": 450
     },
     {
+      "epoch": 3.2,
+      "learning_rate": 1.8033946251768037e-05,
+      "loss": 0.1178,
       "step": 460
     },
     {
+      "epoch": 3.27,
+      "learning_rate": 1.7326732673267325e-05,
+      "loss": 0.091,
       "step": 470
     },
     {
+      "epoch": 3.34,
+      "learning_rate": 1.661951909476662e-05,
+      "loss": 0.0954,
       "step": 480
     },
     {
+      "epoch": 3.41,
+      "learning_rate": 1.5912305516265914e-05,
+      "loss": 0.0845,
       "step": 490
     },
     {
+      "epoch": 3.48,
+      "learning_rate": 1.5205091937765206e-05,
+      "loss": 0.0953,
       "step": 500
     },
     {
+      "epoch": 3.55,
+      "learning_rate": 1.44978783592645e-05,
+      "loss": 0.108,
       "step": 510
     },
     {
+      "epoch": 3.61,
+      "learning_rate": 1.379066478076379e-05,
+      "loss": 0.0578,
       "step": 520
     },
     {
+      "epoch": 3.68,
+      "learning_rate": 1.3083451202263084e-05,
+      "loss": 0.1044,
       "step": 530
     },
     {
+      "epoch": 3.75,
+      "learning_rate": 1.2376237623762377e-05,
+      "loss": 0.0842,
       "step": 540
     },
     {
+      "epoch": 3.82,
+      "learning_rate": 1.166902404526167e-05,
+      "loss": 0.0716,
       "step": 550
     },
     {
+      "epoch": 3.89,
+      "learning_rate": 1.0961810466760961e-05,
+      "loss": 0.0739,
       "step": 560
     },
     {
+      "epoch": 3.96,
+      "learning_rate": 1.0254596888260256e-05,
+      "loss": 0.08,
       "step": 570
     },
     {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9966480446927374,
+      "eval_loss": 0.010998690500855446,
+      "eval_runtime": 23.7024,
+      "eval_samples_per_second": 37.76,
+      "eval_steps_per_second": 4.725,
+      "step": 575
+    },
+    {
+      "epoch": 4.03,
+      "learning_rate": 9.547383309759547e-06,
+      "loss": 0.0684,
       "step": 580
     },
     {
+      "epoch": 4.1,
+      "learning_rate": 8.84016973125884e-06,
+      "loss": 0.0694,
       "step": 590
     },
     {
+      "epoch": 4.17,
+      "learning_rate": 8.132956152758134e-06,
+      "loss": 0.0663,
       "step": 600
     },
     {
+      "epoch": 4.24,
+      "learning_rate": 7.4257425742574256e-06,
+      "loss": 0.0694,
       "step": 610
     },
     {
+      "epoch": 4.31,
+      "learning_rate": 6.718528995756719e-06,
+      "loss": 0.0776,
       "step": 620
     },
     {
+      "epoch": 4.38,
+      "learning_rate": 6.011315417256011e-06,
+      "loss": 0.0785,
       "step": 630
     },
     {
+      "epoch": 4.45,
+      "learning_rate": 5.304101838755304e-06,
+      "loss": 0.0773,
       "step": 640
     },
     {
+      "epoch": 4.52,
+      "learning_rate": 4.596888260254597e-06,
+      "loss": 0.06,
       "step": 650
     },
     {
+      "epoch": 4.59,
+      "learning_rate": 3.889674681753889e-06,
+      "loss": 0.0647,
       "step": 660
     },
     {
+      "epoch": 4.66,
+      "learning_rate": 3.182461103253183e-06,
+      "loss": 0.0821,
       "step": 670
     },
     {
+      "epoch": 4.73,
+      "learning_rate": 2.4752475247524753e-06,
+      "loss": 0.0589,
       "step": 680
     },
     {
+      "epoch": 4.8,
+      "learning_rate": 1.768033946251768e-06,
+      "loss": 0.0604,
       "step": 690
     },
     {
+      "epoch": 4.87,
+      "learning_rate": 1.0608203677510609e-06,
+      "loss": 0.0413,
       "step": 700
     },
     {
+      "epoch": 4.94,
+      "learning_rate": 3.536067892503536e-07,
+      "loss": 0.0575,
       "step": 710
     },
     {
+      "epoch": 4.97,
+      "eval_accuracy": 0.9955307262569832,
+      "eval_loss": 0.012482840567827225,
+      "eval_runtime": 24.0149,
+      "eval_samples_per_second": 37.269,
+      "eval_steps_per_second": 4.664,
+      "step": 715
     },
     {
+      "epoch": 4.97,
+      "step": 715,
+      "total_flos": 9.948639012864492e+17,
+      "train_loss": 0.1435624466075764,
+      "train_runtime": 3458.6134,
+      "train_samples_per_second": 11.641,
+      "train_steps_per_second": 0.207
     }
   ],
+  "max_steps": 715,
+  "num_train_epochs": 5,
+  "total_flos": 9.948639012864492e+17,
   "trial_name": null,
   "trial_params": null
 }