End of training

Browse files

Files changed (5) hide show

all_results.json +13 -0
eval_results.json +8 -0
runs/May07_11-07-59_16e20065002f/events.out.tfevents.1683461532.16e20065002f.183.2 +3 -0
train_results.json +8 -0
trainer_state.json +907 -0

all_results.json ADDED Viewed

	@@ -0,0 +1,13 @@

+{
+    "epoch": 9.94,
+    "eval_accuracy": 1.0,
+    "eval_loss": 0.002956948010250926,
+    "eval_runtime": 23.6672,
+    "eval_samples_per_second": 34.943,
+    "eval_steps_per_second": 4.394,
+    "total_flos": 1.8367349154946929e+18,
+    "train_loss": 0.10741477019407532,
+    "train_runtime": 3799.865,
+    "train_samples_per_second": 19.572,
+    "train_steps_per_second": 0.347
+}

eval_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 9.94,
+    "eval_accuracy": 1.0,
+    "eval_loss": 0.002956948010250926,
+    "eval_runtime": 23.6672,
+    "eval_samples_per_second": 34.943,
+    "eval_steps_per_second": 4.394
+}

runs/May07_11-07-59_16e20065002f/events.out.tfevents.1683461532.16e20065002f.183.2 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:2c3bd713f74cf5b339d23ead7ad36ff6930f4b48ac4a4e1b117ea9a03c5e8f15
+size 411

train_results.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+    "epoch": 9.94,
+    "total_flos": 1.8367349154946929e+18,
+    "train_loss": 0.10741477019407532,
+    "train_runtime": 3799.865,
+    "train_samples_per_second": 19.572,
+    "train_steps_per_second": 0.347
+}

trainer_state.json ADDED Viewed

	@@ -0,0 +1,907 @@

+{
+  "best_metric": 1.0,
+  "best_model_checkpoint": "swin-tiny-patch4-window7-224-LongSleeveCleanedData/checkpoint-930",
+  "epoch": 9.935483870967742,
+  "global_step": 1320,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.08,
+      "learning_rate": 3.571428571428572e-05,
+      "loss": 1.0666,
+      "step": 10
+    },
+    {
+      "epoch": 0.15,
+      "learning_rate": 4.9770290964777946e-05,
+      "loss": 0.7487,
+      "step": 20
+    },
+    {
+      "epoch": 0.23,
+      "learning_rate": 4.93874425727412e-05,
+      "loss": 0.481,
+      "step": 30
+    },
+    {
+      "epoch": 0.3,
+      "learning_rate": 4.900459418070444e-05,
+      "loss": 0.351,
+      "step": 40
+    },
+    {
+      "epoch": 0.38,
+      "learning_rate": 4.862174578866769e-05,
+      "loss": 0.2594,
+      "step": 50
+    },
+    {
+      "epoch": 0.45,
+      "learning_rate": 4.823889739663094e-05,
+      "loss": 0.3307,
+      "step": 60
+    },
+    {
+      "epoch": 0.53,
+      "learning_rate": 4.785604900459418e-05,
+      "loss": 0.2245,
+      "step": 70
+    },
+    {
+      "epoch": 0.6,
+      "learning_rate": 4.747320061255743e-05,
+      "loss": 0.1778,
+      "step": 80
+    },
+    {
+      "epoch": 0.68,
+      "learning_rate": 4.709035222052068e-05,
+      "loss": 0.216,
+      "step": 90
+    },
+    {
+      "epoch": 0.75,
+      "learning_rate": 4.670750382848392e-05,
+      "loss": 0.1601,
+      "step": 100
+    },
+    {
+      "epoch": 0.83,
+      "learning_rate": 4.632465543644717e-05,
+      "loss": 0.2145,
+      "step": 110
+    },
+    {
+      "epoch": 0.9,
+      "learning_rate": 4.594180704441042e-05,
+      "loss": 0.2227,
+      "step": 120
+    },
+    {
+      "epoch": 0.98,
+      "learning_rate": 4.555895865237366e-05,
+      "loss": 0.1472,
+      "step": 130
+    },
+    {
+      "epoch": 0.99,
+      "eval_accuracy": 0.9830713422007256,
+      "eval_loss": 0.04599744826555252,
+      "eval_runtime": 128.5076,
+      "eval_samples_per_second": 6.435,
+      "eval_steps_per_second": 0.809,
+      "step": 132
+    },
+    {
+      "epoch": 1.05,
+      "learning_rate": 4.517611026033691e-05,
+      "loss": 0.1663,
+      "step": 140
+    },
+    {
+      "epoch": 1.13,
+      "learning_rate": 4.479326186830016e-05,
+      "loss": 0.1108,
+      "step": 150
+    },
+    {
+      "epoch": 1.2,
+      "learning_rate": 4.4410413476263404e-05,
+      "loss": 0.1293,
+      "step": 160
+    },
+    {
+      "epoch": 1.28,
+      "learning_rate": 4.402756508422665e-05,
+      "loss": 0.1695,
+      "step": 170
+    },
+    {
+      "epoch": 1.35,
+      "learning_rate": 4.36447166921899e-05,
+      "loss": 0.1437,
+      "step": 180
+    },
+    {
+      "epoch": 1.43,
+      "learning_rate": 4.3261868300153144e-05,
+      "loss": 0.1342,
+      "step": 190
+    },
+    {
+      "epoch": 1.51,
+      "learning_rate": 4.287901990811639e-05,
+      "loss": 0.1243,
+      "step": 200
+    },
+    {
+      "epoch": 1.58,
+      "learning_rate": 4.249617151607963e-05,
+      "loss": 0.1295,
+      "step": 210
+    },
+    {
+      "epoch": 1.66,
+      "learning_rate": 4.211332312404288e-05,
+      "loss": 0.1061,
+      "step": 220
+    },
+    {
+      "epoch": 1.73,
+      "learning_rate": 4.173047473200612e-05,
+      "loss": 0.1433,
+      "step": 230
+    },
+    {
+      "epoch": 1.81,
+      "learning_rate": 4.1347626339969374e-05,
+      "loss": 0.167,
+      "step": 240
+    },
+    {
+      "epoch": 1.88,
+      "learning_rate": 4.096477794793262e-05,
+      "loss": 0.0885,
+      "step": 250
+    },
+    {
+      "epoch": 1.96,
+      "learning_rate": 4.058192955589586e-05,
+      "loss": 0.1171,
+      "step": 260
+    },
+    {
+      "epoch": 1.99,
+      "eval_accuracy": 0.9903264812575574,
+      "eval_loss": 0.021295879036188126,
+      "eval_runtime": 22.6767,
+      "eval_samples_per_second": 36.469,
+      "eval_steps_per_second": 4.586,
+      "step": 265
+    },
+    {
+      "epoch": 2.03,
+      "learning_rate": 4.0199081163859114e-05,
+      "loss": 0.1212,
+      "step": 270
+    },
+    {
+      "epoch": 2.11,
+      "learning_rate": 3.981623277182236e-05,
+      "loss": 0.0869,
+      "step": 280
+    },
+    {
+      "epoch": 2.18,
+      "learning_rate": 3.943338437978561e-05,
+      "loss": 0.106,
+      "step": 290
+    },
+    {
+      "epoch": 2.26,
+      "learning_rate": 3.9050535987748854e-05,
+      "loss": 0.1024,
+      "step": 300
+    },
+    {
+      "epoch": 2.33,
+      "learning_rate": 3.86676875957121e-05,
+      "loss": 0.1124,
+      "step": 310
+    },
+    {
+      "epoch": 2.41,
+      "learning_rate": 3.828483920367535e-05,
+      "loss": 0.0942,
+      "step": 320
+    },
+    {
+      "epoch": 2.48,
+      "learning_rate": 3.7901990811638595e-05,
+      "loss": 0.1147,
+      "step": 330
+    },
+    {
+      "epoch": 2.56,
+      "learning_rate": 3.751914241960184e-05,
+      "loss": 0.0974,
+      "step": 340
+    },
+    {
+      "epoch": 2.63,
+      "learning_rate": 3.713629402756509e-05,
+      "loss": 0.0877,
+      "step": 350
+    },
+    {
+      "epoch": 2.71,
+      "learning_rate": 3.6753445635528335e-05,
+      "loss": 0.093,
+      "step": 360
+    },
+    {
+      "epoch": 2.78,
+      "learning_rate": 3.637059724349158e-05,
+      "loss": 0.0815,
+      "step": 370
+    },
+    {
+      "epoch": 2.86,
+      "learning_rate": 3.598774885145483e-05,
+      "loss": 0.083,
+      "step": 380
+    },
+    {
+      "epoch": 2.94,
+      "learning_rate": 3.5604900459418075e-05,
+      "loss": 0.133,
+      "step": 390
+    },
+    {
+      "epoch": 3.0,
+      "eval_accuracy": 0.9975816203143894,
+      "eval_loss": 0.007586946245282888,
+      "eval_runtime": 21.2686,
+      "eval_samples_per_second": 38.884,
+      "eval_steps_per_second": 4.89,
+      "step": 398
+    },
+    {
+      "epoch": 3.01,
+      "learning_rate": 3.522205206738132e-05,
+      "loss": 0.1194,
+      "step": 400
+    },
+    {
+      "epoch": 3.09,
+      "learning_rate": 3.4839203675344565e-05,
+      "loss": 0.076,
+      "step": 410
+    },
+    {
+      "epoch": 3.16,
+      "learning_rate": 3.445635528330781e-05,
+      "loss": 0.1054,
+      "step": 420
+    },
+    {
+      "epoch": 3.24,
+      "learning_rate": 3.4073506891271054e-05,
+      "loss": 0.1116,
+      "step": 430
+    },
+    {
+      "epoch": 3.31,
+      "learning_rate": 3.3690658499234305e-05,
+      "loss": 0.0979,
+      "step": 440
+    },
+    {
+      "epoch": 3.39,
+      "learning_rate": 3.330781010719755e-05,
+      "loss": 0.0656,
+      "step": 450
+    },
+    {
+      "epoch": 3.46,
+      "learning_rate": 3.2924961715160794e-05,
+      "loss": 0.0599,
+      "step": 460
+    },
+    {
+      "epoch": 3.54,
+      "learning_rate": 3.2542113323124045e-05,
+      "loss": 0.0693,
+      "step": 470
+    },
+    {
+      "epoch": 3.61,
+      "learning_rate": 3.215926493108729e-05,
+      "loss": 0.1082,
+      "step": 480
+    },
+    {
+      "epoch": 3.69,
+      "learning_rate": 3.1776416539050534e-05,
+      "loss": 0.0696,
+      "step": 490
+    },
+    {
+      "epoch": 3.76,
+      "learning_rate": 3.1393568147013786e-05,
+      "loss": 0.0656,
+      "step": 500
+    },
+    {
+      "epoch": 3.84,
+      "learning_rate": 3.101071975497703e-05,
+      "loss": 0.0767,
+      "step": 510
+    },
+    {
+      "epoch": 3.91,
+      "learning_rate": 3.0627871362940275e-05,
+      "loss": 0.1195,
+      "step": 520
+    },
+    {
+      "epoch": 3.99,
+      "learning_rate": 3.0245022970903526e-05,
+      "loss": 0.0714,
+      "step": 530
+    },
+    {
+      "epoch": 4.0,
+      "eval_accuracy": 0.9975816203143894,
+      "eval_loss": 0.008087977766990662,
+      "eval_runtime": 23.253,
+      "eval_samples_per_second": 35.565,
+      "eval_steps_per_second": 4.473,
+      "step": 531
+    },
+    {
+      "epoch": 4.06,
+      "learning_rate": 2.986217457886677e-05,
+      "loss": 0.1059,
+      "step": 540
+    },
+    {
+      "epoch": 4.14,
+      "learning_rate": 2.9479326186830015e-05,
+      "loss": 0.0458,
+      "step": 550
+    },
+    {
+      "epoch": 4.22,
+      "learning_rate": 2.9096477794793263e-05,
+      "loss": 0.0657,
+      "step": 560
+    },
+    {
+      "epoch": 4.29,
+      "learning_rate": 2.8713629402756508e-05,
+      "loss": 0.1046,
+      "step": 570
+    },
+    {
+      "epoch": 4.37,
+      "learning_rate": 2.833078101071976e-05,
+      "loss": 0.0963,
+      "step": 580
+    },
+    {
+      "epoch": 4.44,
+      "learning_rate": 2.7947932618683003e-05,
+      "loss": 0.0883,
+      "step": 590
+    },
+    {
+      "epoch": 4.52,
+      "learning_rate": 2.7565084226646248e-05,
+      "loss": 0.0713,
+      "step": 600
+    },
+    {
+      "epoch": 4.59,
+      "learning_rate": 2.71822358346095e-05,
+      "loss": 0.1307,
+      "step": 610
+    },
+    {
+      "epoch": 4.67,
+      "learning_rate": 2.6799387442572744e-05,
+      "loss": 0.0879,
+      "step": 620
+    },
+    {
+      "epoch": 4.74,
+      "learning_rate": 2.6416539050535988e-05,
+      "loss": 0.1203,
+      "step": 630
+    },
+    {
+      "epoch": 4.82,
+      "learning_rate": 2.603369065849924e-05,
+      "loss": 0.0743,
+      "step": 640
+    },
+    {
+      "epoch": 4.89,
+      "learning_rate": 2.5650842266462484e-05,
+      "loss": 0.0842,
+      "step": 650
+    },
+    {
+      "epoch": 4.97,
+      "learning_rate": 2.526799387442573e-05,
+      "loss": 0.0776,
+      "step": 660
+    },
+    {
+      "epoch": 5.0,
+      "eval_accuracy": 0.9987908101571947,
+      "eval_loss": 0.005263020750135183,
+      "eval_runtime": 23.3335,
+      "eval_samples_per_second": 35.443,
+      "eval_steps_per_second": 4.457,
+      "step": 664
+    },
+    {
+      "epoch": 5.04,
+      "learning_rate": 2.4885145482388973e-05,
+      "loss": 0.1302,
+      "step": 670
+    },
+    {
+      "epoch": 5.12,
+      "learning_rate": 2.450229709035222e-05,
+      "loss": 0.0708,
+      "step": 680
+    },
+    {
+      "epoch": 5.19,
+      "learning_rate": 2.411944869831547e-05,
+      "loss": 0.0717,
+      "step": 690
+    },
+    {
+      "epoch": 5.27,
+      "learning_rate": 2.3736600306278714e-05,
+      "loss": 0.0932,
+      "step": 700
+    },
+    {
+      "epoch": 5.34,
+      "learning_rate": 2.335375191424196e-05,
+      "loss": 0.0895,
+      "step": 710
+    },
+    {
+      "epoch": 5.42,
+      "learning_rate": 2.297090352220521e-05,
+      "loss": 0.0572,
+      "step": 720
+    },
+    {
+      "epoch": 5.49,
+      "learning_rate": 2.2588055130168454e-05,
+      "loss": 0.0798,
+      "step": 730
+    },
+    {
+      "epoch": 5.57,
+      "learning_rate": 2.2205206738131702e-05,
+      "loss": 0.0588,
+      "step": 740
+    },
+    {
+      "epoch": 5.65,
+      "learning_rate": 2.182235834609495e-05,
+      "loss": 0.0785,
+      "step": 750
+    },
+    {
+      "epoch": 5.72,
+      "learning_rate": 2.1439509954058194e-05,
+      "loss": 0.0803,
+      "step": 760
+    },
+    {
+      "epoch": 5.8,
+      "learning_rate": 2.105666156202144e-05,
+      "loss": 0.0648,
+      "step": 770
+    },
+    {
+      "epoch": 5.87,
+      "learning_rate": 2.0673813169984687e-05,
+      "loss": 0.0589,
+      "step": 780
+    },
+    {
+      "epoch": 5.95,
+      "learning_rate": 2.029096477794793e-05,
+      "loss": 0.0812,
+      "step": 790
+    },
+    {
+      "epoch": 6.0,
+      "eval_accuracy": 0.9975816203143894,
+      "eval_loss": 0.004879950545728207,
+      "eval_runtime": 22.7765,
+      "eval_samples_per_second": 36.309,
+      "eval_steps_per_second": 4.566,
+      "step": 797
+    },
+    {
+      "epoch": 6.02,
+      "learning_rate": 1.990811638591118e-05,
+      "loss": 0.0705,
+      "step": 800
+    },
+    {
+      "epoch": 6.1,
+      "learning_rate": 1.9525267993874427e-05,
+      "loss": 0.0651,
+      "step": 810
+    },
+    {
+      "epoch": 6.17,
+      "learning_rate": 1.9142419601837675e-05,
+      "loss": 0.0941,
+      "step": 820
+    },
+    {
+      "epoch": 6.25,
+      "learning_rate": 1.875957120980092e-05,
+      "loss": 0.0627,
+      "step": 830
+    },
+    {
+      "epoch": 6.32,
+      "learning_rate": 1.8376722817764168e-05,
+      "loss": 0.0868,
+      "step": 840
+    },
+    {
+      "epoch": 6.4,
+      "learning_rate": 1.7993874425727415e-05,
+      "loss": 0.066,
+      "step": 850
+    },
+    {
+      "epoch": 6.47,
+      "learning_rate": 1.761102603369066e-05,
+      "loss": 0.0453,
+      "step": 860
+    },
+    {
+      "epoch": 6.55,
+      "learning_rate": 1.7228177641653905e-05,
+      "loss": 0.0536,
+      "step": 870
+    },
+    {
+      "epoch": 6.62,
+      "learning_rate": 1.6845329249617152e-05,
+      "loss": 0.0723,
+      "step": 880
+    },
+    {
+      "epoch": 6.7,
+      "learning_rate": 1.6462480857580397e-05,
+      "loss": 0.0321,
+      "step": 890
+    },
+    {
+      "epoch": 6.77,
+      "learning_rate": 1.6079632465543645e-05,
+      "loss": 0.1033,
+      "step": 900
+    },
+    {
+      "epoch": 6.85,
+      "learning_rate": 1.5696784073506893e-05,
+      "loss": 0.0763,
+      "step": 910
+    },
+    {
+      "epoch": 6.92,
+      "learning_rate": 1.5313935681470137e-05,
+      "loss": 0.0601,
+      "step": 920
+    },
+    {
+      "epoch": 7.0,
+      "learning_rate": 1.4931087289433385e-05,
+      "loss": 0.0658,
+      "step": 930
+    },
+    {
+      "epoch": 7.0,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.002956948010250926,
+      "eval_runtime": 22.0999,
+      "eval_samples_per_second": 37.421,
+      "eval_steps_per_second": 4.706,
+      "step": 930
+    },
+    {
+      "epoch": 7.08,
+      "learning_rate": 1.4548238897396632e-05,
+      "loss": 0.0685,
+      "step": 940
+    },
+    {
+      "epoch": 7.15,
+      "learning_rate": 1.416539050535988e-05,
+      "loss": 0.1036,
+      "step": 950
+    },
+    {
+      "epoch": 7.23,
+      "learning_rate": 1.3782542113323124e-05,
+      "loss": 0.0605,
+      "step": 960
+    },
+    {
+      "epoch": 7.3,
+      "learning_rate": 1.3399693721286372e-05,
+      "loss": 0.0671,
+      "step": 970
+    },
+    {
+      "epoch": 7.38,
+      "learning_rate": 1.301684532924962e-05,
+      "loss": 0.0579,
+      "step": 980
+    },
+    {
+      "epoch": 7.45,
+      "learning_rate": 1.2633996937212864e-05,
+      "loss": 0.0456,
+      "step": 990
+    },
+    {
+      "epoch": 7.53,
+      "learning_rate": 1.225114854517611e-05,
+      "loss": 0.0928,
+      "step": 1000
+    },
+    {
+      "epoch": 7.6,
+      "learning_rate": 1.1868300153139357e-05,
+      "loss": 0.0688,
+      "step": 1010
+    },
+    {
+      "epoch": 7.68,
+      "learning_rate": 1.1485451761102605e-05,
+      "loss": 0.0438,
+      "step": 1020
+    },
+    {
+      "epoch": 7.75,
+      "learning_rate": 1.1102603369065851e-05,
+      "loss": 0.0393,
+      "step": 1030
+    },
+    {
+      "epoch": 7.83,
+      "learning_rate": 1.0719754977029097e-05,
+      "loss": 0.074,
+      "step": 1040
+    },
+    {
+      "epoch": 7.9,
+      "learning_rate": 1.0336906584992343e-05,
+      "loss": 0.0597,
+      "step": 1050
+    },
+    {
+      "epoch": 7.98,
+      "learning_rate": 9.95405819295559e-06,
+      "loss": 0.0804,
+      "step": 1060
+    },
+    {
+      "epoch": 7.99,
+      "eval_accuracy": 0.9975816203143894,
+      "eval_loss": 0.0034685195423662663,
+      "eval_runtime": 22.3239,
+      "eval_samples_per_second": 37.045,
+      "eval_steps_per_second": 4.659,
+      "step": 1062
+    },
+    {
+      "epoch": 8.05,
+      "learning_rate": 9.571209800918838e-06,
+      "loss": 0.0558,
+      "step": 1070
+    },
+    {
+      "epoch": 8.13,
+      "learning_rate": 9.188361408882084e-06,
+      "loss": 0.0275,
+      "step": 1080
+    },
+    {
+      "epoch": 8.2,
+      "learning_rate": 8.80551301684533e-06,
+      "loss": 0.0325,
+      "step": 1090
+    },
+    {
+      "epoch": 8.28,
+      "learning_rate": 8.422664624808576e-06,
+      "loss": 0.0652,
+      "step": 1100
+    },
+    {
+      "epoch": 8.35,
+      "learning_rate": 8.039816232771822e-06,
+      "loss": 0.0559,
+      "step": 1110
+    },
+    {
+      "epoch": 8.43,
+      "learning_rate": 7.656967840735069e-06,
+      "loss": 0.0509,
+      "step": 1120
+    },
+    {
+      "epoch": 8.51,
+      "learning_rate": 7.274119448698316e-06,
+      "loss": 0.0698,
+      "step": 1130
+    },
+    {
+      "epoch": 8.58,
+      "learning_rate": 6.891271056661562e-06,
+      "loss": 0.0676,
+      "step": 1140
+    },
+    {
+      "epoch": 8.66,
+      "learning_rate": 6.50842266462481e-06,
+      "loss": 0.0435,
+      "step": 1150
+    },
+    {
+      "epoch": 8.73,
+      "learning_rate": 6.125574272588055e-06,
+      "loss": 0.0535,
+      "step": 1160
+    },
+    {
+      "epoch": 8.81,
+      "learning_rate": 5.742725880551302e-06,
+      "loss": 0.0499,
+      "step": 1170
+    },
+    {
+      "epoch": 8.88,
+      "learning_rate": 5.359877488514549e-06,
+      "loss": 0.0419,
+      "step": 1180
+    },
+    {
+      "epoch": 8.96,
+      "learning_rate": 4.977029096477795e-06,
+      "loss": 0.0508,
+      "step": 1190
+    },
+    {
+      "epoch": 8.99,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0011118645779788494,
+      "eval_runtime": 22.2701,
+      "eval_samples_per_second": 37.135,
+      "eval_steps_per_second": 4.67,
+      "step": 1195
+    },
+    {
+      "epoch": 9.03,
+      "learning_rate": 4.594180704441042e-06,
+      "loss": 0.054,
+      "step": 1200
+    },
+    {
+      "epoch": 9.11,
+      "learning_rate": 4.211332312404288e-06,
+      "loss": 0.0596,
+      "step": 1210
+    },
+    {
+      "epoch": 9.18,
+      "learning_rate": 3.828483920367534e-06,
+      "loss": 0.0435,
+      "step": 1220
+    },
+    {
+      "epoch": 9.26,
+      "learning_rate": 3.445635528330781e-06,
+      "loss": 0.0677,
+      "step": 1230
+    },
+    {
+      "epoch": 9.33,
+      "learning_rate": 3.0627871362940276e-06,
+      "loss": 0.0548,
+      "step": 1240
+    },
+    {
+      "epoch": 9.41,
+      "learning_rate": 2.6799387442572743e-06,
+      "loss": 0.0587,
+      "step": 1250
+    },
+    {
+      "epoch": 9.48,
+      "learning_rate": 2.297090352220521e-06,
+      "loss": 0.0382,
+      "step": 1260
+    },
+    {
+      "epoch": 9.56,
+      "learning_rate": 1.914241960183767e-06,
+      "loss": 0.0443,
+      "step": 1270
+    },
+    {
+      "epoch": 9.63,
+      "learning_rate": 1.5313935681470138e-06,
+      "loss": 0.0386,
+      "step": 1280
+    },
+    {
+      "epoch": 9.71,
+      "learning_rate": 1.1485451761102605e-06,
+      "loss": 0.0362,
+      "step": 1290
+    },
+    {
+      "epoch": 9.78,
+      "learning_rate": 7.656967840735069e-07,
+      "loss": 0.0478,
+      "step": 1300
+    },
+    {
+      "epoch": 9.86,
+      "learning_rate": 3.8284839203675346e-07,
+      "loss": 0.055,
+      "step": 1310
+    },
+    {
+      "epoch": 9.94,
+      "learning_rate": 0.0,
+      "loss": 0.0725,
+      "step": 1320
+    },
+    {
+      "epoch": 9.94,
+      "eval_accuracy": 1.0,
+      "eval_loss": 0.0010892293648794293,
+      "eval_runtime": 22.2717,
+      "eval_samples_per_second": 37.132,
+      "eval_steps_per_second": 4.67,
+      "step": 1320
+    },
+    {
+      "epoch": 9.94,
+      "step": 1320,
+      "total_flos": 1.8367349154946929e+18,
+      "train_loss": 0.10741477019407532,
+      "train_runtime": 3799.865,
+      "train_samples_per_second": 19.572,
+      "train_steps_per_second": 0.347
+    }
+  ],
+  "max_steps": 1320,
+  "num_train_epochs": 10,
+  "total_flos": 1.8367349154946929e+18,
+  "trial_name": null,
+  "trial_params": null
+}