trantridat/SwinV2Base_lora r64 alpha16 dropout0.05 batchsize64 lr0.001

704546c verified 7 months ago

150 kB

	{
	"best_metric": 0.9160090191657272,
	"best_model_checkpoint": "swinv2-base-patch4-window12-192-22k-finetuned-lora-ISIC-2019/checkpoint-4875",
	"epoch": 99.2,
	"eval_steps": 500,
	"global_step": 6200,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.16,
	"learning_rate": 0.0009983870967741936,
	"loss": 1.4282,
	"step": 10
	},
	{
	"epoch": 0.32,
	"learning_rate": 0.0009970967741935483,
	"loss": 1.1082,
	"step": 20
	},
	{
	"epoch": 0.48,
	"learning_rate": 0.0009954838709677419,
	"loss": 1.0397,
	"step": 30
	},
	{
	"epoch": 0.64,
	"learning_rate": 0.0009938709677419356,
	"loss": 0.9258,
	"step": 40
	},
	{
	"epoch": 0.8,
	"learning_rate": 0.0009922580645161292,
	"loss": 0.8897,
	"step": 50
	},
	{
	"epoch": 0.96,
	"learning_rate": 0.0009906451612903225,
	"loss": 0.8488,
	"step": 60
	},
	{
	"epoch": 0.99,
	"step": 62,
	"train_accuracy": 0.718556119571348,
	"train_f1": 0.6867379798585972,
	"train_loss": 0.770628809928894,
	"train_precision": 0.708956589572109,
	"train_recall": 0.718556119571348,
	"train_runtime": 291.5866,
	"train_samples_per_second": 54.725,
	"train_steps_per_second": 0.857
	},
	{
	"epoch": 0.99,
	"eval_accuracy": 0.7153325817361894,
	"eval_f1": 0.6823083139813236,
	"eval_loss": 0.7977813482284546,
	"eval_precision": 0.7199162830832594,
	"eval_recall": 0.7153325817361894,
	"eval_runtime": 49.2679,
	"eval_samples_per_second": 36.007,
	"eval_steps_per_second": 0.568,
	"step": 62
	},
	{
	"epoch": 1.12,
	"learning_rate": 0.000989032258064516,
	"loss": 0.7836,
	"step": 70
	},
	{
	"epoch": 1.28,
	"learning_rate": 0.0009874193548387096,
	"loss": 0.772,
	"step": 80
	},
	{
	"epoch": 1.44,
	"learning_rate": 0.0009858064516129032,
	"loss": 0.8074,
	"step": 90
	},
	{
	"epoch": 1.6,
	"learning_rate": 0.0009841935483870968,
	"loss": 0.7912,
	"step": 100
	},
	{
	"epoch": 1.76,
	"learning_rate": 0.0009825806451612903,
	"loss": 0.7762,
	"step": 110
	},
	{
	"epoch": 1.92,
	"learning_rate": 0.0009809677419354839,
	"loss": 0.7795,
	"step": 120
	},
	{
	"epoch": 2.0,
	"step": 125,
	"train_accuracy": 0.7600426145265401,
	"train_f1": 0.7540133314127565,
	"train_loss": 0.6639156937599182,
	"train_precision": 0.7611520386158022,
	"train_recall": 0.7600426145265401,
	"train_runtime": 254.6664,
	"train_samples_per_second": 62.658,
	"train_steps_per_second": 0.982
	},
	{
	"epoch": 2.0,
	"eval_accuracy": 0.7497181510710259,
	"eval_f1": 0.7388896367994308,
	"eval_loss": 0.6961308717727661,
	"eval_precision": 0.7541740918352317,
	"eval_recall": 0.7497181510710259,
	"eval_runtime": 48.7662,
	"eval_samples_per_second": 36.378,
	"eval_steps_per_second": 0.574,
	"step": 125
	},
	{
	"epoch": 2.08,
	"learning_rate": 0.0009793548387096774,
	"loss": 0.7586,
	"step": 130
	},
	{
	"epoch": 2.24,
	"learning_rate": 0.000977741935483871,
	"loss": 0.705,
	"step": 140
	},
	{
	"epoch": 2.4,
	"learning_rate": 0.0009761290322580644,
	"loss": 0.6983,
	"step": 150
	},
	{
	"epoch": 2.56,
	"learning_rate": 0.0009745161290322581,
	"loss": 0.6913,
	"step": 160
	},
	{
	"epoch": 2.72,
	"learning_rate": 0.0009729032258064517,
	"loss": 0.6849,
	"step": 170
	},
	{
	"epoch": 2.88,
	"learning_rate": 0.0009714516129032258,
	"loss": 0.7169,
	"step": 180
	},
	{
	"epoch": 2.99,
	"step": 187,
	"train_accuracy": 0.7776524409350128,
	"train_f1": 0.7639537137185656,
	"train_loss": 0.6073001027107239,
	"train_precision": 0.7743141490761454,
	"train_recall": 0.7776524409350128,
	"train_runtime": 256.1493,
	"train_samples_per_second": 62.296,
	"train_steps_per_second": 0.976
	},
	{
	"epoch": 2.99,
	"eval_accuracy": 0.7717023675310034,
	"eval_f1": 0.7547317483415474,
	"eval_loss": 0.6364655494689941,
	"eval_precision": 0.7658539052724858,
	"eval_recall": 0.7717023675310034,
	"eval_runtime": 48.4464,
	"eval_samples_per_second": 36.618,
	"eval_steps_per_second": 0.578,
	"step": 187
	},
	{
	"epoch": 3.04,
	"learning_rate": 0.0009698387096774194,
	"loss": 0.6428,
	"step": 190
	},
	{
	"epoch": 3.2,
	"learning_rate": 0.0009682258064516129,
	"loss": 0.6604,
	"step": 200
	},
	{
	"epoch": 3.36,
	"learning_rate": 0.0009666129032258064,
	"loss": 0.6531,
	"step": 210
	},
	{
	"epoch": 3.52,
	"learning_rate": 0.000965,
	"loss": 0.643,
	"step": 220
	},
	{
	"epoch": 3.68,
	"learning_rate": 0.0009633870967741936,
	"loss": 0.6918,
	"step": 230
	},
	{
	"epoch": 3.84,
	"learning_rate": 0.0009617741935483872,
	"loss": 0.6442,
	"step": 240
	},
	{
	"epoch": 4.0,
	"learning_rate": 0.0009601612903225807,
	"loss": 0.6576,
	"step": 250
	},
	{
	"epoch": 4.0,
	"step": 250,
	"train_accuracy": 0.7903114620542708,
	"train_f1": 0.7760264280771675,
	"train_loss": 0.5970289707183838,
	"train_precision": 0.7953318203400003,
	"train_recall": 0.7903114620542708,
	"train_runtime": 256.7891,
	"train_samples_per_second": 62.14,
	"train_steps_per_second": 0.974
	},
	{
	"epoch": 4.0,
	"eval_accuracy": 0.790304396843292,
	"eval_f1": 0.7777020089235339,
	"eval_loss": 0.6154965162277222,
	"eval_precision": 0.7982692040791739,
	"eval_recall": 0.790304396843292,
	"eval_runtime": 46.9309,
	"eval_samples_per_second": 37.8,
	"eval_steps_per_second": 0.597,
	"step": 250
	},
	{
	"epoch": 4.16,
	"learning_rate": 0.0009585483870967742,
	"loss": 0.6104,
	"step": 260
	},
	{
	"epoch": 4.32,
	"learning_rate": 0.0009569354838709677,
	"loss": 0.5991,
	"step": 270
	},
	{
	"epoch": 4.48,
	"learning_rate": 0.0009553225806451613,
	"loss": 0.625,
	"step": 280
	},
	{
	"epoch": 4.64,
	"learning_rate": 0.0009537096774193548,
	"loss": 0.6223,
	"step": 290
	},
	{
	"epoch": 4.8,
	"learning_rate": 0.0009520967741935485,
	"loss": 0.6309,
	"step": 300
	},
	{
	"epoch": 4.96,
	"learning_rate": 0.000950483870967742,
	"loss": 0.6164,
	"step": 310
	},
	{
	"epoch": 4.99,
	"step": 312,
	"train_accuracy": 0.8017797831672621,
	"train_f1": 0.7931150004910923,
	"train_loss": 0.5476173758506775,
	"train_precision": 0.7996150347194898,
	"train_recall": 0.8017797831672621,
	"train_runtime": 254.273,
	"train_samples_per_second": 62.755,
	"train_steps_per_second": 0.983
	},
	{
	"epoch": 4.99,
	"eval_accuracy": 0.7733934611048479,
	"eval_f1": 0.7627200347192373,
	"eval_loss": 0.5989590883255005,
	"eval_precision": 0.7799215570339676,
	"eval_recall": 0.7733934611048479,
	"eval_runtime": 46.2691,
	"eval_samples_per_second": 38.341,
	"eval_steps_per_second": 0.605,
	"step": 312
	},
	{
	"epoch": 5.12,
	"learning_rate": 0.0009488709677419355,
	"loss": 0.6067,
	"step": 320
	},
	{
	"epoch": 5.28,
	"learning_rate": 0.0009472580645161291,
	"loss": 0.6144,
	"step": 330
	},
	{
	"epoch": 5.44,
	"learning_rate": 0.0009456451612903226,
	"loss": 0.5815,
	"step": 340
	},
	{
	"epoch": 5.6,
	"learning_rate": 0.0009440322580645162,
	"loss": 0.6036,
	"step": 350
	},
	{
	"epoch": 5.76,
	"learning_rate": 0.0009424193548387096,
	"loss": 0.5748,
	"step": 360
	},
	{
	"epoch": 5.92,
	"learning_rate": 0.0009408064516129032,
	"loss": 0.5779,
	"step": 370
	},
	{
	"epoch": 6.0,
	"step": 375,
	"train_accuracy": 0.8046625305508555,
	"train_f1": 0.8003331690711911,
	"train_loss": 0.5287690758705139,
	"train_precision": 0.8066353914139762,
	"train_recall": 0.8046625305508555,
	"train_runtime": 254.1046,
	"train_samples_per_second": 62.797,
	"train_steps_per_second": 0.984
	},
	{
	"epoch": 6.0,
	"eval_accuracy": 0.7745208568207441,
	"eval_f1": 0.7668632966865262,
	"eval_loss": 0.602535605430603,
	"eval_precision": 0.7770132133553053,
	"eval_recall": 0.7745208568207441,
	"eval_runtime": 38.0169,
	"eval_samples_per_second": 46.663,
	"eval_steps_per_second": 0.737,
	"step": 375
	},
	{
	"epoch": 6.08,
	"learning_rate": 0.0009391935483870969,
	"loss": 0.5808,
	"step": 380
	},
	{
	"epoch": 6.24,
	"learning_rate": 0.0009375806451612904,
	"loss": 0.5692,
	"step": 390
	},
	{
	"epoch": 6.4,
	"learning_rate": 0.0009359677419354839,
	"loss": 0.5525,
	"step": 400
	},
	{
	"epoch": 6.56,
	"learning_rate": 0.0009343548387096774,
	"loss": 0.562,
	"step": 410
	},
	{
	"epoch": 6.72,
	"learning_rate": 0.000932741935483871,
	"loss": 0.5858,
	"step": 420
	},
	{
	"epoch": 6.88,
	"learning_rate": 0.0009311290322580645,
	"loss": 0.5647,
	"step": 430
	},
	{
	"epoch": 6.99,
	"step": 437,
	"train_accuracy": 0.8250924359215391,
	"train_f1": 0.8156580365652172,
	"train_loss": 0.4726848304271698,
	"train_precision": 0.8244531001171268,
	"train_recall": 0.8250924359215391,
	"train_runtime": 254.8694,
	"train_samples_per_second": 62.609,
	"train_steps_per_second": 0.981
	},
	{
	"epoch": 6.99,
	"eval_accuracy": 0.8094701240135288,
	"eval_f1": 0.8000649092582361,
	"eval_loss": 0.5391651391983032,
	"eval_precision": 0.8082600629133598,
	"eval_recall": 0.8094701240135288,
	"eval_runtime": 33.5973,
	"eval_samples_per_second": 52.802,
	"eval_steps_per_second": 0.833,
	"step": 437
	},
	{
	"epoch": 7.04,
	"learning_rate": 0.0009295161290322581,
	"loss": 0.5795,
	"step": 440
	},
	{
	"epoch": 7.2,
	"learning_rate": 0.0009279032258064515,
	"loss": 0.535,
	"step": 450
	},
	{
	"epoch": 7.36,
	"learning_rate": 0.0009262903225806451,
	"loss": 0.5441,
	"step": 460
	},
	{
	"epoch": 7.52,
	"learning_rate": 0.0009246774193548388,
	"loss": 0.5329,
	"step": 470
	},
	{
	"epoch": 7.68,
	"learning_rate": 0.0009230645161290323,
	"loss": 0.5191,
	"step": 480
	},
	{
	"epoch": 7.84,
	"learning_rate": 0.0009214516129032259,
	"loss": 0.5428,
	"step": 490
	},
	{
	"epoch": 8.0,
	"learning_rate": 0.0009198387096774193,
	"loss": 0.5062,
	"step": 500
	},
	{
	"epoch": 8.0,
	"step": 500,
	"train_accuracy": 0.8309832675314909,
	"train_f1": 0.8223807681274183,
	"train_loss": 0.4595116674900055,
	"train_precision": 0.8314452738097804,
	"train_recall": 0.8309832675314909,
	"train_runtime": 254.2706,
	"train_samples_per_second": 62.756,
	"train_steps_per_second": 0.983
	},
	{
	"epoch": 8.0,
	"eval_accuracy": 0.8015783540022547,
	"eval_f1": 0.7895223836045016,
	"eval_loss": 0.5510557293891907,
	"eval_precision": 0.8031324191974503,
	"eval_recall": 0.8015783540022547,
	"eval_runtime": 33.1712,
	"eval_samples_per_second": 53.48,
	"eval_steps_per_second": 0.844,
	"step": 500
	},
	{
	"epoch": 8.16,
	"learning_rate": 0.0009182258064516129,
	"loss": 0.5424,
	"step": 510
	},
	{
	"epoch": 8.32,
	"learning_rate": 0.0009166129032258065,
	"loss": 0.5172,
	"step": 520
	},
	{
	"epoch": 8.48,
	"learning_rate": 0.000915,
	"loss": 0.5081,
	"step": 530
	},
	{
	"epoch": 8.64,
	"learning_rate": 0.0009133870967741935,
	"loss": 0.5357,
	"step": 540
	},
	{
	"epoch": 8.8,
	"learning_rate": 0.0009117741935483871,
	"loss": 0.5317,
	"step": 550
	},
	{
	"epoch": 8.96,
	"learning_rate": 0.0009101612903225807,
	"loss": 0.5479,
	"step": 560
	},
	{
	"epoch": 8.99,
	"step": 562,
	"train_accuracy": 0.8421382465375697,
	"train_f1": 0.8356541787788663,
	"train_loss": 0.4283278286457062,
	"train_precision": 0.8418489980800979,
	"train_recall": 0.8421382465375697,
	"train_runtime": 253.325,
	"train_samples_per_second": 62.99,
	"train_steps_per_second": 0.987
	},
	{
	"epoch": 8.99,
	"eval_accuracy": 0.8156708004509583,
	"eval_f1": 0.8099706186065314,
	"eval_loss": 0.5151851773262024,
	"eval_precision": 0.8175937941832333,
	"eval_recall": 0.8156708004509583,
	"eval_runtime": 29.3964,
	"eval_samples_per_second": 60.347,
	"eval_steps_per_second": 0.952,
	"step": 562
	},
	{
	"epoch": 9.12,
	"learning_rate": 0.0009087096774193548,
	"loss": 0.4922,
	"step": 570
	},
	{
	"epoch": 9.28,
	"learning_rate": 0.0009070967741935484,
	"loss": 0.4682,
	"step": 580
	},
	{
	"epoch": 9.44,
	"learning_rate": 0.0009054838709677419,
	"loss": 0.5159,
	"step": 590
	},
	{
	"epoch": 9.6,
	"learning_rate": 0.0009038709677419356,
	"loss": 0.5072,
	"step": 600
	},
	{
	"epoch": 9.76,
	"learning_rate": 0.0009022580645161291,
	"loss": 0.4946,
	"step": 610
	},
	{
	"epoch": 9.92,
	"learning_rate": 0.0009006451612903226,
	"loss": 0.504,
	"step": 620
	},
	{
	"epoch": 10.0,
	"step": 625,
	"train_accuracy": 0.8490317728896409,
	"train_f1": 0.8425370562453873,
	"train_loss": 0.4146420955657959,
	"train_precision": 0.8499471633168426,
	"train_recall": 0.8490317728896409,
	"train_runtime": 252.5657,
	"train_samples_per_second": 63.18,
	"train_steps_per_second": 0.99
	},
	{
	"epoch": 10.0,
	"eval_accuracy": 0.8246899661781285,
	"eval_f1": 0.8181338629292875,
	"eval_loss": 0.4954419434070587,
	"eval_precision": 0.8265610533827844,
	"eval_recall": 0.8246899661781285,
	"eval_runtime": 29.7136,
	"eval_samples_per_second": 59.703,
	"eval_steps_per_second": 0.942,
	"step": 625
	},
	{
	"epoch": 10.08,
	"learning_rate": 0.0008990322580645162,
	"loss": 0.4777,
	"step": 630
	},
	{
	"epoch": 10.24,
	"learning_rate": 0.0008974193548387097,
	"loss": 0.4595,
	"step": 640
	},
	{
	"epoch": 10.4,
	"learning_rate": 0.0008958064516129032,
	"loss": 0.4765,
	"step": 650
	},
	{
	"epoch": 10.56,
	"learning_rate": 0.0008941935483870967,
	"loss": 0.481,
	"step": 660
	},
	{
	"epoch": 10.72,
	"learning_rate": 0.0008925806451612903,
	"loss": 0.4936,
	"step": 670
	},
	{
	"epoch": 10.88,
	"learning_rate": 0.0008909677419354839,
	"loss": 0.4928,
	"step": 680
	},
	{
	"epoch": 10.99,
	"step": 687,
	"train_accuracy": 0.8662029203484364,
	"train_f1": 0.8651095243578739,
	"train_loss": 0.36719974875450134,
	"train_precision": 0.8661939607708877,
	"train_recall": 0.8662029203484364,
	"train_runtime": 248.0205,
	"train_samples_per_second": 64.337,
	"train_steps_per_second": 1.008
	},
	{
	"epoch": 10.99,
	"eval_accuracy": 0.8325817361894025,
	"eval_f1": 0.8330415565435833,
	"eval_loss": 0.4721773862838745,
	"eval_precision": 0.8382637561400605,
	"eval_recall": 0.8325817361894025,
	"eval_runtime": 29.1932,
	"eval_samples_per_second": 60.768,
	"eval_steps_per_second": 0.959,
	"step": 687
	},
	{
	"epoch": 11.04,
	"learning_rate": 0.0008893548387096775,
	"loss": 0.4791,
	"step": 690
	},
	{
	"epoch": 11.2,
	"learning_rate": 0.000887741935483871,
	"loss": 0.471,
	"step": 700
	},
	{
	"epoch": 11.36,
	"learning_rate": 0.0008861290322580645,
	"loss": 0.4514,
	"step": 710
	},
	{
	"epoch": 11.52,
	"learning_rate": 0.0008845161290322581,
	"loss": 0.4554,
	"step": 720
	},
	{
	"epoch": 11.68,
	"learning_rate": 0.0008829032258064516,
	"loss": 0.4778,
	"step": 730
	},
	{
	"epoch": 11.84,
	"learning_rate": 0.0008812903225806452,
	"loss": 0.4214,
	"step": 740
	},
	{
	"epoch": 12.0,
	"learning_rate": 0.0008796774193548387,
	"loss": 0.4555,
	"step": 750
	},
	{
	"epoch": 12.0,
	"step": 750,
	"train_accuracy": 0.8760418625054834,
	"train_f1": 0.8735297151164703,
	"train_loss": 0.341611385345459,
	"train_precision": 0.8749284746900984,
	"train_recall": 0.8760418625054834,
	"train_runtime": 251.381,
	"train_samples_per_second": 63.477,
	"train_steps_per_second": 0.995
	},
	{
	"epoch": 12.0,
	"eval_accuracy": 0.846674182638106,
	"eval_f1": 0.8431872563091386,
	"eval_loss": 0.43833523988723755,
	"eval_precision": 0.8434438125814474,
	"eval_recall": 0.846674182638106,
	"eval_runtime": 29.6753,
	"eval_samples_per_second": 59.78,
	"eval_steps_per_second": 0.944,
	"step": 750
	},
	{
	"epoch": 12.16,
	"learning_rate": 0.0008780645161290322,
	"loss": 0.4597,
	"step": 760
	},
	{
	"epoch": 12.32,
	"learning_rate": 0.0008764516129032259,
	"loss": 0.4253,
	"step": 770
	},
	{
	"epoch": 12.48,
	"learning_rate": 0.0008748387096774194,
	"loss": 0.473,
	"step": 780
	},
	{
	"epoch": 12.64,
	"learning_rate": 0.0008732258064516129,
	"loss": 0.4244,
	"step": 790
	},
	{
	"epoch": 12.8,
	"learning_rate": 0.0008716129032258064,
	"loss": 0.4602,
	"step": 800
	},
	{
	"epoch": 12.96,
	"learning_rate": 0.00087,
	"loss": 0.4345,
	"step": 810
	},
	{
	"epoch": 12.99,
	"step": 812,
	"train_accuracy": 0.8737857993357148,
	"train_f1": 0.8699664840253412,
	"train_loss": 0.3363898992538452,
	"train_precision": 0.8723546877750733,
	"train_recall": 0.8737857993357148,
	"train_runtime": 254.2635,
	"train_samples_per_second": 62.758,
	"train_steps_per_second": 0.983
	},
	{
	"epoch": 12.99,
	"eval_accuracy": 0.8511837655016911,
	"eval_f1": 0.8464360738395965,
	"eval_loss": 0.44016385078430176,
	"eval_precision": 0.8479714249543402,
	"eval_recall": 0.8511837655016911,
	"eval_runtime": 29.6817,
	"eval_samples_per_second": 59.767,
	"eval_steps_per_second": 0.943,
	"step": 812
	},
	{
	"epoch": 13.12,
	"learning_rate": 0.0008683870967741936,
	"loss": 0.4296,
	"step": 820
	},
	{
	"epoch": 13.28,
	"learning_rate": 0.0008667741935483871,
	"loss": 0.4024,
	"step": 830
	},
	{
	"epoch": 13.44,
	"learning_rate": 0.0008651612903225806,
	"loss": 0.4268,
	"step": 840
	},
	{
	"epoch": 13.6,
	"learning_rate": 0.0008635483870967742,
	"loss": 0.411,
	"step": 850
	},
	{
	"epoch": 13.76,
	"learning_rate": 0.0008619354838709678,
	"loss": 0.4179,
	"step": 860
	},
	{
	"epoch": 13.92,
	"learning_rate": 0.0008603225806451614,
	"loss": 0.4398,
	"step": 870
	},
	{
	"epoch": 14.0,
	"step": 875,
	"train_accuracy": 0.880553988845021,
	"train_f1": 0.8770183301442244,
	"train_loss": 0.3260194957256317,
	"train_precision": 0.8807172403068199,
	"train_recall": 0.880553988845021,
	"train_runtime": 252.7172,
	"train_samples_per_second": 63.142,
	"train_steps_per_second": 0.989
	},
	{
	"epoch": 14.0,
	"eval_accuracy": 0.8494926719278467,
	"eval_f1": 0.8469368583418073,
	"eval_loss": 0.44426438212394714,
	"eval_precision": 0.8497246468797232,
	"eval_recall": 0.8494926719278467,
	"eval_runtime": 29.5345,
	"eval_samples_per_second": 60.065,
	"eval_steps_per_second": 0.948,
	"step": 875
	},
	{
	"epoch": 14.08,
	"learning_rate": 0.0008587096774193549,
	"loss": 0.4153,
	"step": 880
	},
	{
	"epoch": 14.24,
	"learning_rate": 0.0008570967741935484,
	"loss": 0.4065,
	"step": 890
	},
	{
	"epoch": 14.4,
	"learning_rate": 0.0008554838709677419,
	"loss": 0.4045,
	"step": 900
	},
	{
	"epoch": 14.56,
	"learning_rate": 0.0008538709677419355,
	"loss": 0.3879,
	"step": 910
	},
	{
	"epoch": 14.72,
	"learning_rate": 0.000852258064516129,
	"loss": 0.4095,
	"step": 920
	},
	{
	"epoch": 14.88,
	"learning_rate": 0.0008506451612903226,
	"loss": 0.405,
	"step": 930
	},
	{
	"epoch": 14.99,
	"step": 937,
	"train_accuracy": 0.8919596415366297,
	"train_f1": 0.8898750533747908,
	"train_loss": 0.29893702268600464,
	"train_precision": 0.8905204704311594,
	"train_recall": 0.8919596415366297,
	"train_runtime": 255.1579,
	"train_samples_per_second": 62.538,
	"train_steps_per_second": 0.98
	},
	{
	"epoch": 14.99,
	"eval_accuracy": 0.8568207440811725,
	"eval_f1": 0.8543462911384269,
	"eval_loss": 0.4096240699291229,
	"eval_precision": 0.8552780691368613,
	"eval_recall": 0.8568207440811725,
	"eval_runtime": 29.6726,
	"eval_samples_per_second": 59.786,
	"eval_steps_per_second": 0.944,
	"step": 937
	},
	{
	"epoch": 15.04,
	"learning_rate": 0.0008490322580645162,
	"loss": 0.4047,
	"step": 940
	},
	{
	"epoch": 15.2,
	"learning_rate": 0.0008474193548387097,
	"loss": 0.4049,
	"step": 950
	},
	{
	"epoch": 15.36,
	"learning_rate": 0.0008458064516129033,
	"loss": 0.39,
	"step": 960
	},
	{
	"epoch": 15.52,
	"learning_rate": 0.0008441935483870968,
	"loss": 0.4253,
	"step": 970
	},
	{
	"epoch": 15.68,
	"learning_rate": 0.0008425806451612903,
	"loss": 0.3707,
	"step": 980
	},
	{
	"epoch": 15.84,
	"learning_rate": 0.0008409677419354838,
	"loss": 0.389,
	"step": 990
	},
	{
	"epoch": 16.0,
	"learning_rate": 0.0008393548387096774,
	"loss": 0.4069,
	"step": 1000
	},
	{
	"epoch": 16.0,
	"step": 1000,
	"train_accuracy": 0.8934636836498089,
	"train_f1": 0.8909693605701321,
	"train_loss": 0.2904220521450043,
	"train_precision": 0.893519044249712,
	"train_recall": 0.8934636836498089,
	"train_runtime": 254.2734,
	"train_samples_per_second": 62.755,
	"train_steps_per_second": 0.983
	},
	{
	"epoch": 16.0,
	"eval_accuracy": 0.8500563697857948,
	"eval_f1": 0.8452271271553625,
	"eval_loss": 0.4389975965023041,
	"eval_precision": 0.851487739267586,
	"eval_recall": 0.8500563697857948,
	"eval_runtime": 29.5522,
	"eval_samples_per_second": 60.029,
	"eval_steps_per_second": 0.947,
	"step": 1000
	},
	{
	"epoch": 16.16,
	"learning_rate": 0.0008377419354838711,
	"loss": 0.389,
	"step": 1010
	},
	{
	"epoch": 16.32,
	"learning_rate": 0.0008361290322580646,
	"loss": 0.3682,
	"step": 1020
	},
	{
	"epoch": 16.48,
	"learning_rate": 0.0008345161290322581,
	"loss": 0.3746,
	"step": 1030
	},
	{
	"epoch": 16.64,
	"learning_rate": 0.0008329032258064516,
	"loss": 0.3817,
	"step": 1040
	},
	{
	"epoch": 16.8,
	"learning_rate": 0.0008312903225806452,
	"loss": 0.3652,
	"step": 1050
	},
	{
	"epoch": 16.96,
	"learning_rate": 0.0008296774193548387,
	"loss": 0.3774,
	"step": 1060
	},
	{
	"epoch": 16.99,
	"step": 1062,
	"train_accuracy": 0.9058093626621545,
	"train_f1": 0.9046539806661633,
	"train_loss": 0.2608683109283447,
	"train_precision": 0.9049170910236276,
	"train_recall": 0.9058093626621545,
	"train_runtime": 253.2237,
	"train_samples_per_second": 63.015,
	"train_steps_per_second": 0.987
	},
	{
	"epoch": 16.99,
	"eval_accuracy": 0.8579481397970687,
	"eval_f1": 0.8563523858127897,
	"eval_loss": 0.415022075176239,
	"eval_precision": 0.8576310002165511,
	"eval_recall": 0.8579481397970687,
	"eval_runtime": 29.5963,
	"eval_samples_per_second": 59.94,
	"eval_steps_per_second": 0.946,
	"step": 1062
	},
	{
	"epoch": 17.12,
	"learning_rate": 0.0008280645161290323,
	"loss": 0.3537,
	"step": 1070
	},
	{
	"epoch": 17.28,
	"learning_rate": 0.0008264516129032257,
	"loss": 0.3743,
	"step": 1080
	},
	{
	"epoch": 17.44,
	"learning_rate": 0.0008248387096774194,
	"loss": 0.3648,
	"step": 1090
	},
	{
	"epoch": 17.6,
	"learning_rate": 0.000823225806451613,
	"loss": 0.3659,
	"step": 1100
	},
	{
	"epoch": 17.76,
	"learning_rate": 0.0008216129032258065,
	"loss": 0.3713,
	"step": 1110
	},
	{
	"epoch": 17.92,
	"learning_rate": 0.00082,
	"loss": 0.3631,
	"step": 1120
	},
	{
	"epoch": 18.0,
	"step": 1125,
	"train_accuracy": 0.9117628626934887,
	"train_f1": 0.9111752276141204,
	"train_loss": 0.24888941645622253,
	"train_precision": 0.9116531142476182,
	"train_recall": 0.9117628626934887,
	"train_runtime": 253.2878,
	"train_samples_per_second": 62.999,
	"train_steps_per_second": 0.987
	},
	{
	"epoch": 18.0,
	"eval_accuracy": 0.85456595264938,
	"eval_f1": 0.8546917151279523,
	"eval_loss": 0.42011961340904236,
	"eval_precision": 0.858590913110437,
	"eval_recall": 0.85456595264938,
	"eval_runtime": 29.5881,
	"eval_samples_per_second": 59.956,
	"eval_steps_per_second": 0.946,
	"step": 1125
	},
	{
	"epoch": 18.08,
	"learning_rate": 0.0008183870967741935,
	"loss": 0.3537,
	"step": 1130
	},
	{
	"epoch": 18.24,
	"learning_rate": 0.0008167741935483871,
	"loss": 0.3214,
	"step": 1140
	},
	{
	"epoch": 18.4,
	"learning_rate": 0.0008151612903225807,
	"loss": 0.3464,
	"step": 1150
	},
	{
	"epoch": 18.56,
	"learning_rate": 0.0008135483870967742,
	"loss": 0.3503,
	"step": 1160
	},
	{
	"epoch": 18.72,
	"learning_rate": 0.0008119354838709677,
	"loss": 0.3745,
	"step": 1170
	},
	{
	"epoch": 18.88,
	"learning_rate": 0.0008103225806451613,
	"loss": 0.3458,
	"step": 1180
	},
	{
	"epoch": 18.99,
	"step": 1187,
	"train_accuracy": 0.912326878485931,
	"train_f1": 0.9113314150149505,
	"train_loss": 0.24995951354503632,
	"train_precision": 0.9115719864017833,
	"train_recall": 0.912326878485931,
	"train_runtime": 254.6215,
	"train_samples_per_second": 62.669,
	"train_steps_per_second": 0.982
	},
	{
	"epoch": 18.99,
	"eval_accuracy": 0.8562570462232244,
	"eval_f1": 0.8542249820828076,
	"eval_loss": 0.40477874875068665,
	"eval_precision": 0.8544614619611243,
	"eval_recall": 0.8562570462232244,
	"eval_runtime": 29.856,
	"eval_samples_per_second": 59.418,
	"eval_steps_per_second": 0.938,
	"step": 1187
	},
	{
	"epoch": 19.04,
	"learning_rate": 0.0008087096774193549,
	"loss": 0.3953,
	"step": 1190
	},
	{
	"epoch": 19.2,
	"learning_rate": 0.0008070967741935484,
	"loss": 0.3386,
	"step": 1200
	},
	{
	"epoch": 19.36,
	"learning_rate": 0.000805483870967742,
	"loss": 0.3322,
	"step": 1210
	},
	{
	"epoch": 19.52,
	"learning_rate": 0.0008038709677419355,
	"loss": 0.3425,
	"step": 1220
	},
	{
	"epoch": 19.68,
	"learning_rate": 0.000802258064516129,
	"loss": 0.3448,
	"step": 1230
	},
	{
	"epoch": 19.84,
	"learning_rate": 0.0008006451612903226,
	"loss": 0.3534,
	"step": 1240
	},
	{
	"epoch": 20.0,
	"learning_rate": 0.0007990322580645161,
	"loss": 0.3361,
	"step": 1250
	},
	{
	"epoch": 20.0,
	"step": 1250,
	"train_accuracy": 0.9059346995049194,
	"train_f1": 0.9033631776657957,
	"train_loss": 0.2528255581855774,
	"train_precision": 0.9064546977324616,
	"train_recall": 0.9059346995049194,
	"train_runtime": 252.7613,
	"train_samples_per_second": 63.131,
	"train_steps_per_second": 0.989
	},
	{
	"epoch": 20.0,
	"eval_accuracy": 0.8596392333709132,
	"eval_f1": 0.8566333454163209,
	"eval_loss": 0.4370974004268646,
	"eval_precision": 0.8585278408293291,
	"eval_recall": 0.8596392333709132,
	"eval_runtime": 29.8096,
	"eval_samples_per_second": 59.511,
	"eval_steps_per_second": 0.939,
	"step": 1250
	},
	{
	"epoch": 20.16,
	"learning_rate": 0.0007974193548387097,
	"loss": 0.3154,
	"step": 1260
	},
	{
	"epoch": 20.32,
	"learning_rate": 0.0007958064516129032,
	"loss": 0.3478,
	"step": 1270
	},
	{
	"epoch": 20.48,
	"learning_rate": 0.0007941935483870968,
	"loss": 0.3385,
	"step": 1280
	},
	{
	"epoch": 20.64,
	"learning_rate": 0.0007925806451612904,
	"loss": 0.3327,
	"step": 1290
	},
	{
	"epoch": 20.8,
	"learning_rate": 0.0007909677419354839,
	"loss": 0.3398,
	"step": 1300
	},
	{
	"epoch": 20.96,
	"learning_rate": 0.0007893548387096774,
	"loss": 0.3386,
	"step": 1310
	},
	{
	"epoch": 20.99,
	"step": 1312,
	"train_accuracy": 0.9205991101084163,
	"train_f1": 0.9202297733826367,
	"train_loss": 0.22639435529708862,
	"train_precision": 0.9204915599848654,
	"train_recall": 0.9205991101084163,
	"train_runtime": 253.7128,
	"train_samples_per_second": 62.894,
	"train_steps_per_second": 0.985
	},
	{
	"epoch": 20.99,
	"eval_accuracy": 0.8686583990980834,
	"eval_f1": 0.8680154821185954,
	"eval_loss": 0.39551448822021484,
	"eval_precision": 0.8689593382775722,
	"eval_recall": 0.8686583990980834,
	"eval_runtime": 29.773,
	"eval_samples_per_second": 59.584,
	"eval_steps_per_second": 0.94,
	"step": 1312
	},
	{
	"epoch": 21.12,
	"learning_rate": 0.0007877419354838709,
	"loss": 0.3038,
	"step": 1320
	},
	{
	"epoch": 21.28,
	"learning_rate": 0.0007861290322580645,
	"loss": 0.3157,
	"step": 1330
	},
	{
	"epoch": 21.44,
	"learning_rate": 0.0007845161290322582,
	"loss": 0.318,
	"step": 1340
	},
	{
	"epoch": 21.6,
	"learning_rate": 0.0007829032258064517,
	"loss": 0.2993,
	"step": 1350
	},
	{
	"epoch": 21.76,
	"learning_rate": 0.0007812903225806452,
	"loss": 0.3185,
	"step": 1360
	},
	{
	"epoch": 21.92,
	"learning_rate": 0.0007796774193548387,
	"loss": 0.3091,
	"step": 1370
	},
	{
	"epoch": 22.0,
	"step": 1375,
	"train_accuracy": 0.9207871153725637,
	"train_f1": 0.919568201335574,
	"train_loss": 0.21673625707626343,
	"train_precision": 0.9203664780549666,
	"train_recall": 0.9207871153725637,
	"train_runtime": 249.1604,
	"train_samples_per_second": 64.043,
	"train_steps_per_second": 1.003
	},
	{
	"epoch": 22.0,
	"eval_accuracy": 0.8680947012401353,
	"eval_f1": 0.8657724581221397,
	"eval_loss": 0.4277941584587097,
	"eval_precision": 0.8671942484944011,
	"eval_recall": 0.8680947012401353,
	"eval_runtime": 29.1495,
	"eval_samples_per_second": 60.859,
	"eval_steps_per_second": 0.961,
	"step": 1375
	},
	{
	"epoch": 22.08,
	"learning_rate": 0.0007780645161290323,
	"loss": 0.3109,
	"step": 1380
	},
	{
	"epoch": 22.24,
	"learning_rate": 0.0007764516129032258,
	"loss": 0.3082,
	"step": 1390
	},
	{
	"epoch": 22.4,
	"learning_rate": 0.0007748387096774193,
	"loss": 0.3133,
	"step": 1400
	},
	{
	"epoch": 22.56,
	"learning_rate": 0.0007732258064516128,
	"loss": 0.3217,
	"step": 1410
	},
	{
	"epoch": 22.72,
	"learning_rate": 0.0007716129032258065,
	"loss": 0.3145,
	"step": 1420
	},
	{
	"epoch": 22.88,
	"learning_rate": 0.0007700000000000001,
	"loss": 0.3081,
	"step": 1430
	},
	{
	"epoch": 22.99,
	"step": 1437,
	"train_accuracy": 0.9301247101585511,
	"train_f1": 0.9298726796945993,
	"train_loss": 0.2020701915025711,
	"train_precision": 0.9301061473852973,
	"train_recall": 0.9301247101585511,
	"train_runtime": 248.5533,
	"train_samples_per_second": 64.2,
	"train_steps_per_second": 1.006
	},
	{
	"epoch": 22.99,
	"eval_accuracy": 0.8675310033821871,
	"eval_f1": 0.8662116604826631,
	"eval_loss": 0.39544782042503357,
	"eval_precision": 0.866086748268126,
	"eval_recall": 0.8675310033821871,
	"eval_runtime": 29.2034,
	"eval_samples_per_second": 60.746,
	"eval_steps_per_second": 0.959,
	"step": 1437
	},
	{
	"epoch": 23.04,
	"learning_rate": 0.0007683870967741936,
	"loss": 0.3357,
	"step": 1440
	},
	{
	"epoch": 23.2,
	"learning_rate": 0.0007667741935483871,
	"loss": 0.2981,
	"step": 1450
	},
	{
	"epoch": 23.36,
	"learning_rate": 0.0007651612903225806,
	"loss": 0.2823,
	"step": 1460
	},
	{
	"epoch": 23.52,
	"learning_rate": 0.0007635483870967742,
	"loss": 0.3036,
	"step": 1470
	},
	{
	"epoch": 23.68,
	"learning_rate": 0.0007619354838709678,
	"loss": 0.3097,
	"step": 1480
	},
	{
	"epoch": 23.84,
	"learning_rate": 0.0007603225806451613,
	"loss": 0.3004,
	"step": 1490
	},
	{
	"epoch": 24.0,
	"learning_rate": 0.0007587096774193549,
	"loss": 0.3031,
	"step": 1500
	},
	{
	"epoch": 24.0,
	"step": 1500,
	"train_accuracy": 0.9242965469699819,
	"train_f1": 0.9232184701149497,
	"train_loss": 0.20474377274513245,
	"train_precision": 0.9253522346156541,
	"train_recall": 0.9242965469699819,
	"train_runtime": 248.6452,
	"train_samples_per_second": 64.176,
	"train_steps_per_second": 1.005
	},
	{
	"epoch": 24.0,
	"eval_accuracy": 0.8720405862457723,
	"eval_f1": 0.8716583234363133,
	"eval_loss": 0.42239370942115784,
	"eval_precision": 0.8734092383360484,
	"eval_recall": 0.8720405862457723,
	"eval_runtime": 29.0555,
	"eval_samples_per_second": 61.055,
	"eval_steps_per_second": 0.964,
	"step": 1500
	},
	{
	"epoch": 24.16,
	"learning_rate": 0.0007570967741935484,
	"loss": 0.2858,
	"step": 1510
	},
	{
	"epoch": 24.32,
	"learning_rate": 0.000755483870967742,
	"loss": 0.2999,
	"step": 1520
	},
	{
	"epoch": 24.48,
	"learning_rate": 0.0007538709677419355,
	"loss": 0.3135,
	"step": 1530
	},
	{
	"epoch": 24.64,
	"learning_rate": 0.000752258064516129,
	"loss": 0.2951,
	"step": 1540
	},
	{
	"epoch": 24.8,
	"learning_rate": 0.0007506451612903225,
	"loss": 0.3136,
	"step": 1550
	},
	{
	"epoch": 24.96,
	"learning_rate": 0.0007490322580645161,
	"loss": 0.2918,
	"step": 1560
	},
	{
	"epoch": 24.99,
	"step": 1562,
	"train_accuracy": 0.9315660838503478,
	"train_f1": 0.9309767971055543,
	"train_loss": 0.1887647807598114,
	"train_precision": 0.9311524146378474,
	"train_recall": 0.9315660838503478,
	"train_runtime": 249.2905,
	"train_samples_per_second": 64.01,
	"train_steps_per_second": 1.003
	},
	{
	"epoch": 24.99,
	"eval_accuracy": 0.8680947012401353,
	"eval_f1": 0.8669054461224185,
	"eval_loss": 0.43037477135658264,
	"eval_precision": 0.8673301666844889,
	"eval_recall": 0.8680947012401353,
	"eval_runtime": 29.0965,
	"eval_samples_per_second": 60.97,
	"eval_steps_per_second": 0.962,
	"step": 1562
	},
	{
	"epoch": 25.12,
	"learning_rate": 0.0007474193548387097,
	"loss": 0.2943,
	"step": 1570
	},
	{
	"epoch": 25.28,
	"learning_rate": 0.0007458064516129033,
	"loss": 0.2796,
	"step": 1580
	},
	{
	"epoch": 25.44,
	"learning_rate": 0.0007441935483870968,
	"loss": 0.2712,
	"step": 1590
	},
	{
	"epoch": 25.6,
	"learning_rate": 0.0007425806451612903,
	"loss": 0.2862,
	"step": 1600
	},
	{
	"epoch": 25.76,
	"learning_rate": 0.0007409677419354839,
	"loss": 0.2833,
	"step": 1610
	},
	{
	"epoch": 25.92,
	"learning_rate": 0.0007393548387096775,
	"loss": 0.2594,
	"step": 1620
	},
	{
	"epoch": 26.0,
	"step": 1625,
	"train_accuracy": 0.934824841762236,
	"train_f1": 0.9340766757397655,
	"train_loss": 0.18092262744903564,
	"train_precision": 0.9349816666427498,
	"train_recall": 0.934824841762236,
	"train_runtime": 249.0812,
	"train_samples_per_second": 64.063,
	"train_steps_per_second": 1.004
	},
	{
	"epoch": 26.0,
	"eval_accuracy": 0.8776775648252536,
	"eval_f1": 0.8766912677805229,
	"eval_loss": 0.421634703874588,
	"eval_precision": 0.8774332235361698,
	"eval_recall": 0.8776775648252536,
	"eval_runtime": 30.0967,
	"eval_samples_per_second": 58.943,
	"eval_steps_per_second": 0.93,
	"step": 1625
	},
	{
	"epoch": 26.08,
	"learning_rate": 0.000737741935483871,
	"loss": 0.2729,
	"step": 1630
	},
	{
	"epoch": 26.24,
	"learning_rate": 0.0007361290322580645,
	"loss": 0.2801,
	"step": 1640
	},
	{
	"epoch": 26.4,
	"learning_rate": 0.000734516129032258,
	"loss": 0.2653,
	"step": 1650
	},
	{
	"epoch": 26.56,
	"learning_rate": 0.0007329032258064517,
	"loss": 0.3044,
	"step": 1660
	},
	{
	"epoch": 26.72,
	"learning_rate": 0.0007312903225806452,
	"loss": 0.2751,
	"step": 1670
	},
	{
	"epoch": 26.88,
	"learning_rate": 0.0007296774193548388,
	"loss": 0.3028,
	"step": 1680
	},
	{
	"epoch": 26.99,
	"step": 1687,
	"train_accuracy": 0.93670489440371,
	"train_f1": 0.9361197667432394,
	"train_loss": 0.1785627156496048,
	"train_precision": 0.9365292015778245,
	"train_recall": 0.93670489440371,
	"train_runtime": 255.0897,
	"train_samples_per_second": 62.554,
	"train_steps_per_second": 0.98
	},
	{
	"epoch": 26.99,
	"eval_accuracy": 0.8810597519729425,
	"eval_f1": 0.8793922695566861,
	"eval_loss": 0.40421751141548157,
	"eval_precision": 0.8798634255905717,
	"eval_recall": 0.8810597519729425,
	"eval_runtime": 45.5693,
	"eval_samples_per_second": 38.93,
	"eval_steps_per_second": 0.614,
	"step": 1687
	},
	{
	"epoch": 27.04,
	"learning_rate": 0.0007280645161290323,
	"loss": 0.2499,
	"step": 1690
	},
	{
	"epoch": 27.2,
	"learning_rate": 0.0007264516129032258,
	"loss": 0.2792,
	"step": 1700
	},
	{
	"epoch": 27.36,
	"learning_rate": 0.0007248387096774194,
	"loss": 0.2792,
	"step": 1710
	},
	{
	"epoch": 27.52,
	"learning_rate": 0.0007232258064516129,
	"loss": 0.2865,
	"step": 1720
	},
	{
	"epoch": 27.68,
	"learning_rate": 0.0007216129032258064,
	"loss": 0.2845,
	"step": 1730
	},
	{
	"epoch": 27.84,
	"learning_rate": 0.0007199999999999999,
	"loss": 0.2861,
	"step": 1740
	},
	{
	"epoch": 28.0,
	"learning_rate": 0.0007183870967741936,
	"loss": 0.2758,
	"step": 1750
	},
	{
	"epoch": 28.0,
	"step": 1750,
	"train_accuracy": 0.938459610202419,
	"train_f1": 0.9377525981628592,
	"train_loss": 0.1685272455215454,
	"train_precision": 0.9389554252034343,
	"train_recall": 0.938459610202419,
	"train_runtime": 253.2422,
	"train_samples_per_second": 63.011,
	"train_steps_per_second": 0.987
	},
	{
	"epoch": 28.0,
	"eval_accuracy": 0.8680947012401353,
	"eval_f1": 0.8681614791663694,
	"eval_loss": 0.41954031586647034,
	"eval_precision": 0.8691594298818118,
	"eval_recall": 0.8680947012401353,
	"eval_runtime": 47.5593,
	"eval_samples_per_second": 37.301,
	"eval_steps_per_second": 0.589,
	"step": 1750
	},
	{
	"epoch": 28.16,
	"learning_rate": 0.0007167741935483872,
	"loss": 0.2659,
	"step": 1760
	},
	{
	"epoch": 28.32,
	"learning_rate": 0.0007151612903225807,
	"loss": 0.2522,
	"step": 1770
	},
	{
	"epoch": 28.48,
	"learning_rate": 0.0007135483870967742,
	"loss": 0.2755,
	"step": 1780
	},
	{
	"epoch": 28.64,
	"learning_rate": 0.0007119354838709677,
	"loss": 0.2736,
	"step": 1790
	},
	{
	"epoch": 28.8,
	"learning_rate": 0.0007103225806451613,
	"loss": 0.2847,
	"step": 1800
	},
	{
	"epoch": 28.96,
	"learning_rate": 0.0007087096774193548,
	"loss": 0.2833,
	"step": 1810
	},
	{
	"epoch": 28.99,
	"step": 1812,
	"train_accuracy": 0.9406530049508053,
	"train_f1": 0.9397675181987466,
	"train_loss": 0.16751761734485626,
	"train_precision": 0.9410854777530413,
	"train_recall": 0.9406530049508053,
	"train_runtime": 254.9572,
	"train_samples_per_second": 62.587,
	"train_steps_per_second": 0.981
	},
	{
	"epoch": 28.99,
	"eval_accuracy": 0.8759864712514093,
	"eval_f1": 0.872766620485809,
	"eval_loss": 0.37792226672172546,
	"eval_precision": 0.8741418008848874,
	"eval_recall": 0.8759864712514093,
	"eval_runtime": 41.0022,
	"eval_samples_per_second": 43.266,
	"eval_steps_per_second": 0.683,
	"step": 1812
	},
	{
	"epoch": 29.12,
	"learning_rate": 0.0007070967741935484,
	"loss": 0.2487,
	"step": 1820
	},
	{
	"epoch": 29.28,
	"learning_rate": 0.000705483870967742,
	"loss": 0.2712,
	"step": 1830
	},
	{
	"epoch": 29.44,
	"learning_rate": 0.0007038709677419355,
	"loss": 0.243,
	"step": 1840
	},
	{
	"epoch": 29.6,
	"learning_rate": 0.0007022580645161291,
	"loss": 0.2438,
	"step": 1850
	},
	{
	"epoch": 29.76,
	"learning_rate": 0.0007006451612903226,
	"loss": 0.2834,
	"step": 1860
	},
	{
	"epoch": 29.92,
	"learning_rate": 0.0006990322580645161,
	"loss": 0.2414,
	"step": 1870
	},
	{
	"epoch": 30.0,
	"step": 1875,
	"train_accuracy": 0.9470451839318168,
	"train_f1": 0.9467087754155913,
	"train_loss": 0.15353631973266602,
	"train_precision": 0.9468910650190296,
	"train_recall": 0.9470451839318168,
	"train_runtime": 255.1175,
	"train_samples_per_second": 62.548,
	"train_steps_per_second": 0.98
	},
	{
	"epoch": 30.0,
	"eval_accuracy": 0.8799323562570462,
	"eval_f1": 0.8785953814489085,
	"eval_loss": 0.4351659119129181,
	"eval_precision": 0.8796722516525893,
	"eval_recall": 0.8799323562570462,
	"eval_runtime": 38.7284,
	"eval_samples_per_second": 45.806,
	"eval_steps_per_second": 0.723,
	"step": 1875
	},
	{
	"epoch": 30.08,
	"learning_rate": 0.0006974193548387096,
	"loss": 0.2458,
	"step": 1880
	},
	{
	"epoch": 30.24,
	"learning_rate": 0.0006958064516129032,
	"loss": 0.2436,
	"step": 1890
	},
	{
	"epoch": 30.4,
	"learning_rate": 0.0006941935483870968,
	"loss": 0.2279,
	"step": 1900
	},
	{
	"epoch": 30.56,
	"learning_rate": 0.0006925806451612904,
	"loss": 0.2496,
	"step": 1910
	},
	{
	"epoch": 30.72,
	"learning_rate": 0.0006909677419354839,
	"loss": 0.2527,
	"step": 1920
	},
	{
	"epoch": 30.88,
	"learning_rate": 0.0006893548387096774,
	"loss": 0.2508,
	"step": 1930
	},
	{
	"epoch": 30.99,
	"step": 1937,
	"train_accuracy": 0.945729147082785,
	"train_f1": 0.9452594948649355,
	"train_loss": 0.14930781722068787,
	"train_precision": 0.9455852542228912,
	"train_recall": 0.945729147082785,
	"train_runtime": 254.6951,
	"train_samples_per_second": 62.651,
	"train_steps_per_second": 0.982
	},
	{
	"epoch": 30.99,
	"eval_accuracy": 0.887260428410372,
	"eval_f1": 0.8853880807732613,
	"eval_loss": 0.418369859457016,
	"eval_precision": 0.8856923487657594,
	"eval_recall": 0.887260428410372,
	"eval_runtime": 39.5926,
	"eval_samples_per_second": 44.806,
	"eval_steps_per_second": 0.707,
	"step": 1937
	},
	{
	"epoch": 31.04,
	"learning_rate": 0.000687741935483871,
	"loss": 0.2344,
	"step": 1940
	},
	{
	"epoch": 31.2,
	"learning_rate": 0.0006861290322580645,
	"loss": 0.2417,
	"step": 1950
	},
	{
	"epoch": 31.36,
	"learning_rate": 0.0006845161290322581,
	"loss": 0.252,
	"step": 1960
	},
	{
	"epoch": 31.52,
	"learning_rate": 0.0006829032258064516,
	"loss": 0.2465,
	"step": 1970
	},
	{
	"epoch": 31.68,
	"learning_rate": 0.0006812903225806451,
	"loss": 0.2405,
	"step": 1980
	},
	{
	"epoch": 31.84,
	"learning_rate": 0.0006796774193548388,
	"loss": 0.2275,
	"step": 1990
	},
	{
	"epoch": 32.0,
	"learning_rate": 0.0006780645161290323,
	"loss": 0.2509,
	"step": 2000
	},
	{
	"epoch": 32.0,
	"step": 2000,
	"train_accuracy": 0.9509932944789121,
	"train_f1": 0.950617708879211,
	"train_loss": 0.14158745110034943,
	"train_precision": 0.9510854186462011,
	"train_recall": 0.9509932944789121,
	"train_runtime": 255.2742,
	"train_samples_per_second": 62.509,
	"train_steps_per_second": 0.979
	},
	{
	"epoch": 32.0,
	"eval_accuracy": 0.8889515219842165,
	"eval_f1": 0.8871024769373068,
	"eval_loss": 0.41492128372192383,
	"eval_precision": 0.8891530304505318,
	"eval_recall": 0.8889515219842165,
	"eval_runtime": 35.6073,
	"eval_samples_per_second": 49.821,
	"eval_steps_per_second": 0.786,
	"step": 2000
	},
	{
	"epoch": 32.16,
	"learning_rate": 0.0006764516129032258,
	"loss": 0.22,
	"step": 2010
	},
	{
	"epoch": 32.32,
	"learning_rate": 0.0006748387096774193,
	"loss": 0.243,
	"step": 2020
	},
	{
	"epoch": 32.48,
	"learning_rate": 0.0006732258064516129,
	"loss": 0.2465,
	"step": 2030
	},
	{
	"epoch": 32.64,
	"learning_rate": 0.0006716129032258065,
	"loss": 0.2352,
	"step": 2040
	},
	{
	"epoch": 32.8,
	"learning_rate": 0.00067,
	"loss": 0.2314,
	"step": 2050
	},
	{
	"epoch": 32.96,
	"learning_rate": 0.0006683870967741935,
	"loss": 0.2425,
	"step": 2060
	},
	{
	"epoch": 32.99,
	"step": 2062,
	"train_accuracy": 0.9521839944851789,
	"train_f1": 0.9519406193802002,
	"train_loss": 0.13532106578350067,
	"train_precision": 0.9520376150741188,
	"train_recall": 0.9521839944851789,
	"train_runtime": 253.863,
	"train_samples_per_second": 62.857,
	"train_steps_per_second": 0.985
	},
	{
	"epoch": 32.99,
	"eval_accuracy": 0.8900789177001127,
	"eval_f1": 0.8892207946311137,
	"eval_loss": 0.41321179270744324,
	"eval_precision": 0.889613661345136,
	"eval_recall": 0.8900789177001127,
	"eval_runtime": 34.1249,
	"eval_samples_per_second": 51.985,
	"eval_steps_per_second": 0.821,
	"step": 2062
	},
	{
	"epoch": 33.12,
	"learning_rate": 0.0006667741935483871,
	"loss": 0.2533,
	"step": 2070
	},
	{
	"epoch": 33.28,
	"learning_rate": 0.0006651612903225807,
	"loss": 0.2495,
	"step": 2080
	},
	{
	"epoch": 33.44,
	"learning_rate": 0.0006635483870967743,
	"loss": 0.2216,
	"step": 2090
	},
	{
	"epoch": 33.6,
	"learning_rate": 0.0006619354838709678,
	"loss": 0.2334,
	"step": 2100
	},
	{
	"epoch": 33.76,
	"learning_rate": 0.0006603225806451613,
	"loss": 0.209,
	"step": 2110
	},
	{
	"epoch": 33.92,
	"learning_rate": 0.0006587096774193548,
	"loss": 0.2319,
	"step": 2120
	},
	{
	"epoch": 34.0,
	"step": 2125,
	"train_accuracy": 0.9527480102776211,
	"train_f1": 0.9523272165039456,
	"train_loss": 0.13454996049404144,
	"train_precision": 0.9527286937272258,
	"train_recall": 0.9527480102776211,
	"train_runtime": 253.9192,
	"train_samples_per_second": 62.843,
	"train_steps_per_second": 0.985
	},
	{
	"epoch": 34.0,
	"eval_accuracy": 0.8906426155580609,
	"eval_f1": 0.8896475365939425,
	"eval_loss": 0.3986554443836212,
	"eval_precision": 0.889369678049395,
	"eval_recall": 0.8906426155580609,
	"eval_runtime": 32.2322,
	"eval_samples_per_second": 55.038,
	"eval_steps_per_second": 0.869,
	"step": 2125
	},
	{
	"epoch": 34.08,
	"learning_rate": 0.0006570967741935484,
	"loss": 0.2142,
	"step": 2130
	},
	{
	"epoch": 34.24,
	"learning_rate": 0.0006554838709677419,
	"loss": 0.195,
	"step": 2140
	},
	{
	"epoch": 34.4,
	"learning_rate": 0.0006538709677419356,
	"loss": 0.2257,
	"step": 2150
	},
	{
	"epoch": 34.56,
	"learning_rate": 0.000652258064516129,
	"loss": 0.2191,
	"step": 2160
	},
	{
	"epoch": 34.72,
	"learning_rate": 0.0006506451612903226,
	"loss": 0.2472,
	"step": 2170
	},
	{
	"epoch": 34.88,
	"learning_rate": 0.0006490322580645162,
	"loss": 0.256,
	"step": 2180
	},
	{
	"epoch": 34.99,
	"step": 2187,
	"train_accuracy": 0.956633452403334,
	"train_f1": 0.9563227521739598,
	"train_loss": 0.13102850317955017,
	"train_precision": 0.9566100366343153,
	"train_recall": 0.956633452403334,
	"train_runtime": 255.8713,
	"train_samples_per_second": 62.363,
	"train_steps_per_second": 0.977
	},
	{
	"epoch": 34.99,
	"eval_accuracy": 0.8878241262683202,
	"eval_f1": 0.8863562863477997,
	"eval_loss": 0.40525099635124207,
	"eval_precision": 0.8863594064224781,
	"eval_recall": 0.8878241262683202,
	"eval_runtime": 29.2139,
	"eval_samples_per_second": 60.725,
	"eval_steps_per_second": 0.958,
	"step": 2187
	},
	{
	"epoch": 35.04,
	"learning_rate": 0.0006474193548387097,
	"loss": 0.2196,
	"step": 2190
	},
	{
	"epoch": 35.2,
	"learning_rate": 0.0006458064516129032,
	"loss": 0.208,
	"step": 2200
	},
	{
	"epoch": 35.36,
	"learning_rate": 0.0006441935483870967,
	"loss": 0.2125,
	"step": 2210
	},
	{
	"epoch": 35.52,
	"learning_rate": 0.0006425806451612903,
	"loss": 0.234,
	"step": 2220
	},
	{
	"epoch": 35.68,
	"learning_rate": 0.0006409677419354839,
	"loss": 0.2161,
	"step": 2230
	},
	{
	"epoch": 35.84,
	"learning_rate": 0.0006393548387096775,
	"loss": 0.2384,
	"step": 2240
	},
	{
	"epoch": 36.0,
	"learning_rate": 0.000637741935483871,
	"loss": 0.2005,
	"step": 2250
	},
	{
	"epoch": 36.0,
	"step": 2250,
	"train_accuracy": 0.9563201102964216,
	"train_f1": 0.9559487475587907,
	"train_loss": 0.1280374825000763,
	"train_precision": 0.95649817681943,
	"train_recall": 0.9563201102964216,
	"train_runtime": 249.7425,
	"train_samples_per_second": 63.894,
	"train_steps_per_second": 1.001
	},
	{
	"epoch": 36.0,
	"eval_accuracy": 0.8906426155580609,
	"eval_f1": 0.8889303745678712,
	"eval_loss": 0.42412662506103516,
	"eval_precision": 0.8905735232548874,
	"eval_recall": 0.8906426155580609,
	"eval_runtime": 29.236,
	"eval_samples_per_second": 60.679,
	"eval_steps_per_second": 0.958,
	"step": 2250
	},
	{
	"epoch": 36.16,
	"learning_rate": 0.0006361290322580645,
	"loss": 0.2062,
	"step": 2260
	},
	{
	"epoch": 36.32,
	"learning_rate": 0.0006345161290322581,
	"loss": 0.2251,
	"step": 2270
	},
	{
	"epoch": 36.48,
	"learning_rate": 0.0006329032258064516,
	"loss": 0.2086,
	"step": 2280
	},
	{
	"epoch": 36.64,
	"learning_rate": 0.0006312903225806452,
	"loss": 0.2239,
	"step": 2290
	},
	{
	"epoch": 36.8,
	"learning_rate": 0.0006296774193548387,
	"loss": 0.2053,
	"step": 2300
	},
	{
	"epoch": 36.96,
	"learning_rate": 0.0006280645161290322,
	"loss": 0.2151,
	"step": 2310
	},
	{
	"epoch": 36.99,
	"step": 2312,
	"train_accuracy": 0.9576361471454534,
	"train_f1": 0.9574828276125282,
	"train_loss": 0.12214481085538864,
	"train_precision": 0.9575674620543635,
	"train_recall": 0.9576361471454534,
	"train_runtime": 250.154,
	"train_samples_per_second": 63.789,
	"train_steps_per_second": 0.999
	},
	{
	"epoch": 36.99,
	"eval_accuracy": 0.8928974069898534,
	"eval_f1": 0.8924893933635943,
	"eval_loss": 0.44935598969459534,
	"eval_precision": 0.89342937260661,
	"eval_recall": 0.8928974069898534,
	"eval_runtime": 28.948,
	"eval_samples_per_second": 61.282,
	"eval_steps_per_second": 0.967,
	"step": 2312
	},
	{
	"epoch": 37.12,
	"learning_rate": 0.0006264516129032259,
	"loss": 0.2049,
	"step": 2320
	},
	{
	"epoch": 37.28,
	"learning_rate": 0.0006248387096774194,
	"loss": 0.2165,
	"step": 2330
	},
	{
	"epoch": 37.44,
	"learning_rate": 0.0006232258064516129,
	"loss": 0.2106,
	"step": 2340
	},
	{
	"epoch": 37.6,
	"learning_rate": 0.0006216129032258064,
	"loss": 0.211,
	"step": 2350
	},
	{
	"epoch": 37.76,
	"learning_rate": 0.00062,
	"loss": 0.1914,
	"step": 2360
	},
	{
	"epoch": 37.92,
	"learning_rate": 0.0006183870967741936,
	"loss": 0.2264,
	"step": 2370
	},
	{
	"epoch": 38.0,
	"step": 2375,
	"train_accuracy": 0.9594535313655449,
	"train_f1": 0.9591420123249457,
	"train_loss": 0.11748312413692474,
	"train_precision": 0.9594846416905936,
	"train_recall": 0.9594535313655449,
	"train_runtime": 250.2463,
	"train_samples_per_second": 63.765,
	"train_steps_per_second": 0.999
	},
	{
	"epoch": 38.0,
	"eval_accuracy": 0.8889515219842165,
	"eval_f1": 0.8874516370478664,
	"eval_loss": 0.39475908875465393,
	"eval_precision": 0.8871997983000491,
	"eval_recall": 0.8889515219842165,
	"eval_runtime": 29.3223,
	"eval_samples_per_second": 60.5,
	"eval_steps_per_second": 0.955,
	"step": 2375
	},
	{
	"epoch": 38.08,
	"learning_rate": 0.0006167741935483871,
	"loss": 0.2018,
	"step": 2380
	},
	{
	"epoch": 38.24,
	"learning_rate": 0.0006151612903225806,
	"loss": 0.2047,
	"step": 2390
	},
	{
	"epoch": 38.4,
	"learning_rate": 0.0006135483870967742,
	"loss": 0.1931,
	"step": 2400
	},
	{
	"epoch": 38.56,
	"learning_rate": 0.0006119354838709678,
	"loss": 0.1973,
	"step": 2410
	},
	{
	"epoch": 38.72,
	"learning_rate": 0.0006103225806451613,
	"loss": 0.1901,
	"step": 2420
	},
	{
	"epoch": 38.88,
	"learning_rate": 0.0006087096774193549,
	"loss": 0.2128,
	"step": 2430
	},
	{
	"epoch": 38.99,
	"step": 2437,
	"train_accuracy": 0.9598295418938397,
	"train_f1": 0.959583924650842,
	"train_loss": 0.12042330950498581,
	"train_precision": 0.9599378088639902,
	"train_recall": 0.9598295418938397,
	"train_runtime": 250.3192,
	"train_samples_per_second": 63.747,
	"train_steps_per_second": 0.999
	},
	{
	"epoch": 38.99,
	"eval_accuracy": 0.8934611048478016,
	"eval_f1": 0.8921610181685623,
	"eval_loss": 0.4096975028514862,
	"eval_precision": 0.8925841926833548,
	"eval_recall": 0.8934611048478016,
	"eval_runtime": 29.0714,
	"eval_samples_per_second": 61.022,
	"eval_steps_per_second": 0.963,
	"step": 2437
	},
	{
	"epoch": 39.04,
	"learning_rate": 0.0006070967741935484,
	"loss": 0.2022,
	"step": 2440
	},
	{
	"epoch": 39.2,
	"learning_rate": 0.0006054838709677419,
	"loss": 0.2015,
	"step": 2450
	},
	{
	"epoch": 39.36,
	"learning_rate": 0.0006038709677419355,
	"loss": 0.1906,
	"step": 2460
	},
	{
	"epoch": 39.52,
	"learning_rate": 0.000602258064516129,
	"loss": 0.2003,
	"step": 2470
	},
	{
	"epoch": 39.68,
	"learning_rate": 0.0006006451612903226,
	"loss": 0.2248,
	"step": 2480
	},
	{
	"epoch": 39.84,
	"learning_rate": 0.0005990322580645161,
	"loss": 0.1946,
	"step": 2490
	},
	{
	"epoch": 40.0,
	"learning_rate": 0.0005974193548387097,
	"loss": 0.2025,
	"step": 2500
	},
	{
	"epoch": 40.0,
	"step": 2500,
	"train_accuracy": 0.9597668734724573,
	"train_f1": 0.9596223430089906,
	"train_loss": 0.11334564536809921,
	"train_precision": 0.9597271475233058,
	"train_recall": 0.9597668734724573,
	"train_runtime": 249.5517,
	"train_samples_per_second": 63.943,
	"train_steps_per_second": 1.002
	},
	{
	"epoch": 40.0,
	"eval_accuracy": 0.8906426155580609,
	"eval_f1": 0.8896192336703185,
	"eval_loss": 0.4116363823413849,
	"eval_precision": 0.8906240785065708,
	"eval_recall": 0.8906426155580609,
	"eval_runtime": 29.0689,
	"eval_samples_per_second": 61.027,
	"eval_steps_per_second": 0.963,
	"step": 2500
	},
	{
	"epoch": 40.16,
	"learning_rate": 0.0005958064516129033,
	"loss": 0.1783,
	"step": 2510
	},
	{
	"epoch": 40.32,
	"learning_rate": 0.0005941935483870968,
	"loss": 0.1915,
	"step": 2520
	},
	{
	"epoch": 40.48,
	"learning_rate": 0.0005925806451612903,
	"loss": 0.2113,
	"step": 2530
	},
	{
	"epoch": 40.64,
	"learning_rate": 0.0005909677419354838,
	"loss": 0.1906,
	"step": 2540
	},
	{
	"epoch": 40.8,
	"learning_rate": 0.0005893548387096774,
	"loss": 0.1835,
	"step": 2550
	},
	{
	"epoch": 40.96,
	"learning_rate": 0.0005877419354838711,
	"loss": 0.2171,
	"step": 2560
	},
	{
	"epoch": 40.99,
	"step": 2562,
	"train_accuracy": 0.9614589208497838,
	"train_f1": 0.9612864417727561,
	"train_loss": 0.11530015617609024,
	"train_precision": 0.9614218707043837,
	"train_recall": 0.9614589208497838,
	"train_runtime": 250.011,
	"train_samples_per_second": 63.825,
	"train_steps_per_second": 1.0
	},
	{
	"epoch": 40.99,
	"eval_accuracy": 0.8917700112739572,
	"eval_f1": 0.890807210174242,
	"eval_loss": 0.39598962664604187,
	"eval_precision": 0.8908114942653367,
	"eval_recall": 0.8917700112739572,
	"eval_runtime": 29.1379,
	"eval_samples_per_second": 60.883,
	"eval_steps_per_second": 0.961,
	"step": 2562
	},
	{
	"epoch": 41.12,
	"learning_rate": 0.0005861290322580646,
	"loss": 0.1964,
	"step": 2570
	},
	{
	"epoch": 41.28,
	"learning_rate": 0.0005845161290322581,
	"loss": 0.1827,
	"step": 2580
	},
	{
	"epoch": 41.44,
	"learning_rate": 0.0005829032258064516,
	"loss": 0.2079,
	"step": 2590
	},
	{
	"epoch": 41.6,
	"learning_rate": 0.0005812903225806452,
	"loss": 0.2013,
	"step": 2600
	},
	{
	"epoch": 41.76,
	"learning_rate": 0.0005796774193548387,
	"loss": 0.2037,
	"step": 2610
	},
	{
	"epoch": 41.92,
	"learning_rate": 0.0005780645161290323,
	"loss": 0.2036,
	"step": 2620
	},
	{
	"epoch": 42.0,
	"step": 2625,
	"train_accuracy": 0.9622736103277558,
	"train_f1": 0.9620354688265563,
	"train_loss": 0.10922261327505112,
	"train_precision": 0.9625027768138478,
	"train_recall": 0.9622736103277558,
	"train_runtime": 249.7106,
	"train_samples_per_second": 63.902,
	"train_steps_per_second": 1.001
	},
	{
	"epoch": 42.0,
	"eval_accuracy": 0.8928974069898534,
	"eval_f1": 0.891600694267099,
	"eval_loss": 0.3954656422138214,
	"eval_precision": 0.8932440084981708,
	"eval_recall": 0.8928974069898534,
	"eval_runtime": 29.1604,
	"eval_samples_per_second": 60.836,
	"eval_steps_per_second": 0.96,
	"step": 2625
	},
	{
	"epoch": 42.08,
	"learning_rate": 0.0005764516129032257,
	"loss": 0.1971,
	"step": 2630
	},
	{
	"epoch": 42.24,
	"learning_rate": 0.0005748387096774194,
	"loss": 0.1976,
	"step": 2640
	},
	{
	"epoch": 42.4,
	"learning_rate": 0.000573225806451613,
	"loss": 0.2098,
	"step": 2650
	},
	{
	"epoch": 42.56,
	"learning_rate": 0.0005716129032258065,
	"loss": 0.1833,
	"step": 2660
	},
	{
	"epoch": 42.72,
	"learning_rate": 0.00057,
	"loss": 0.1936,
	"step": 2670
	},
	{
	"epoch": 42.88,
	"learning_rate": 0.0005683870967741935,
	"loss": 0.1849,
	"step": 2680
	},
	{
	"epoch": 42.99,
	"step": 2687,
	"train_accuracy": 0.9676004261452654,
	"train_f1": 0.9675534222659815,
	"train_loss": 0.10426949709653854,
	"train_precision": 0.9676367935294685,
	"train_recall": 0.9676004261452654,
	"train_runtime": 251.7545,
	"train_samples_per_second": 63.383,
	"train_steps_per_second": 0.993
	},
	{
	"epoch": 42.99,
	"eval_accuracy": 0.8996617812852311,
	"eval_f1": 0.8986036298251875,
	"eval_loss": 0.3904741108417511,
	"eval_precision": 0.8992691335353804,
	"eval_recall": 0.8996617812852311,
	"eval_runtime": 29.0995,
	"eval_samples_per_second": 60.963,
	"eval_steps_per_second": 0.962,
	"step": 2687
	},
	{
	"epoch": 43.04,
	"learning_rate": 0.0005667741935483871,
	"loss": 0.2041,
	"step": 2690
	},
	{
	"epoch": 43.2,
	"learning_rate": 0.0005651612903225807,
	"loss": 0.174,
	"step": 2700
	},
	{
	"epoch": 43.36,
	"learning_rate": 0.0005635483870967742,
	"loss": 0.1792,
	"step": 2710
	},
	{
	"epoch": 43.52,
	"learning_rate": 0.0005619354838709677,
	"loss": 0.1688,
	"step": 2720
	},
	{
	"epoch": 43.68,
	"learning_rate": 0.0005603225806451613,
	"loss": 0.1741,
	"step": 2730
	},
	{
	"epoch": 43.84,
	"learning_rate": 0.0005587096774193549,
	"loss": 0.2102,
	"step": 2740
	},
	{
	"epoch": 44.0,
	"learning_rate": 0.0005570967741935484,
	"loss": 0.1852,
	"step": 2750
	},
	{
	"epoch": 44.0,
	"step": 2750,
	"train_accuracy": 0.964843015604437,
	"train_f1": 0.9647050151290405,
	"train_loss": 0.10291223973035812,
	"train_precision": 0.9649053412080801,
	"train_recall": 0.964843015604437,
	"train_runtime": 250.3464,
	"train_samples_per_second": 63.74,
	"train_steps_per_second": 0.999
	},
	{
	"epoch": 44.0,
	"eval_accuracy": 0.891206313416009,
	"eval_f1": 0.8900612906872463,
	"eval_loss": 0.42409268021583557,
	"eval_precision": 0.891982003380522,
	"eval_recall": 0.891206313416009,
	"eval_runtime": 29.1706,
	"eval_samples_per_second": 60.815,
	"eval_steps_per_second": 0.96,
	"step": 2750
	},
	{
	"epoch": 44.16,
	"learning_rate": 0.000555483870967742,
	"loss": 0.1816,
	"step": 2760
	},
	{
	"epoch": 44.32,
	"learning_rate": 0.0005538709677419355,
	"loss": 0.1765,
	"step": 2770
	},
	{
	"epoch": 44.48,
	"learning_rate": 0.000552258064516129,
	"loss": 0.1748,
	"step": 2780
	},
	{
	"epoch": 44.64,
	"learning_rate": 0.0005506451612903226,
	"loss": 0.2168,
	"step": 2790
	},
	{
	"epoch": 44.8,
	"learning_rate": 0.0005490322580645161,
	"loss": 0.215,
	"step": 2800
	},
	{
	"epoch": 44.96,
	"learning_rate": 0.0005474193548387097,
	"loss": 0.1721,
	"step": 2810
	},
	{
	"epoch": 44.99,
	"step": 2812,
	"train_accuracy": 0.9665350629817635,
	"train_f1": 0.9664032195703065,
	"train_loss": 0.09303626418113708,
	"train_precision": 0.9665823467276443,
	"train_recall": 0.9665350629817635,
	"train_runtime": 250.871,
	"train_samples_per_second": 63.606,
	"train_steps_per_second": 0.997
	},
	{
	"epoch": 44.99,
	"eval_accuracy": 0.8962795941375423,
	"eval_f1": 0.8948599549258702,
	"eval_loss": 0.4103808104991913,
	"eval_precision": 0.8955637765539853,
	"eval_recall": 0.8962795941375423,
	"eval_runtime": 29.0827,
	"eval_samples_per_second": 60.998,
	"eval_steps_per_second": 0.963,
	"step": 2812
	},
	{
	"epoch": 45.12,
	"learning_rate": 0.0005458064516129032,
	"loss": 0.1553,
	"step": 2820
	},
	{
	"epoch": 45.28,
	"learning_rate": 0.0005441935483870968,
	"loss": 0.1801,
	"step": 2830
	},
	{
	"epoch": 45.44,
	"learning_rate": 0.0005425806451612904,
	"loss": 0.1815,
	"step": 2840
	},
	{
	"epoch": 45.6,
	"learning_rate": 0.0005409677419354839,
	"loss": 0.2039,
	"step": 2850
	},
	{
	"epoch": 45.76,
	"learning_rate": 0.0005393548387096774,
	"loss": 0.1867,
	"step": 2860
	},
	{
	"epoch": 45.92,
	"learning_rate": 0.0005377419354838709,
	"loss": 0.186,
	"step": 2870
	},
	{
	"epoch": 46.0,
	"step": 2875,
	"train_accuracy": 0.9643416682333772,
	"train_f1": 0.9642012339068207,
	"train_loss": 0.09887776523828506,
	"train_precision": 0.9644991194334305,
	"train_recall": 0.9643416682333772,
	"train_runtime": 254.5578,
	"train_samples_per_second": 62.685,
	"train_steps_per_second": 0.982
	},
	{
	"epoch": 46.0,
	"eval_accuracy": 0.8917700112739572,
	"eval_f1": 0.8901319153136237,
	"eval_loss": 0.4248127341270447,
	"eval_precision": 0.8912530636364911,
	"eval_recall": 0.8917700112739572,
	"eval_runtime": 29.5608,
	"eval_samples_per_second": 60.012,
	"eval_steps_per_second": 0.947,
	"step": 2875
	},
	{
	"epoch": 46.08,
	"learning_rate": 0.0005361290322580645,
	"loss": 0.1569,
	"step": 2880
	},
	{
	"epoch": 46.24,
	"learning_rate": 0.0005345161290322581,
	"loss": 0.1876,
	"step": 2890
	},
	{
	"epoch": 46.4,
	"learning_rate": 0.0005329032258064517,
	"loss": 0.1667,
	"step": 2900
	},
	{
	"epoch": 46.56,
	"learning_rate": 0.0005312903225806452,
	"loss": 0.169,
	"step": 2910
	},
	{
	"epoch": 46.72,
	"learning_rate": 0.0005296774193548387,
	"loss": 0.1803,
	"step": 2920
	},
	{
	"epoch": 46.88,
	"learning_rate": 0.0005280645161290323,
	"loss": 0.1811,
	"step": 2930
	},
	{
	"epoch": 46.99,
	"step": 2937,
	"train_accuracy": 0.9637149840195526,
	"train_f1": 0.9634798755891425,
	"train_loss": 0.10527843236923218,
	"train_precision": 0.9638723537275108,
	"train_recall": 0.9637149840195526,
	"train_runtime": 254.7727,
	"train_samples_per_second": 62.632,
	"train_steps_per_second": 0.981
	},
	{
	"epoch": 46.99,
	"eval_accuracy": 0.9013528748590756,
	"eval_f1": 0.8999103289546431,
	"eval_loss": 0.42358672618865967,
	"eval_precision": 0.9005857132412932,
	"eval_recall": 0.9013528748590756,
	"eval_runtime": 29.8042,
	"eval_samples_per_second": 59.522,
	"eval_steps_per_second": 0.939,
	"step": 2937
	},
	{
	"epoch": 47.04,
	"learning_rate": 0.0005264516129032258,
	"loss": 0.1698,
	"step": 2940
	},
	{
	"epoch": 47.2,
	"learning_rate": 0.0005248387096774193,
	"loss": 0.1744,
	"step": 2950
	},
	{
	"epoch": 47.36,
	"learning_rate": 0.0005232258064516128,
	"loss": 0.1718,
	"step": 2960
	},
	{
	"epoch": 47.52,
	"learning_rate": 0.0005216129032258065,
	"loss": 0.1777,
	"step": 2970
	},
	{
	"epoch": 47.68,
	"learning_rate": 0.0005200000000000001,
	"loss": 0.1872,
	"step": 2980
	},
	{
	"epoch": 47.84,
	"learning_rate": 0.0005183870967741936,
	"loss": 0.1586,
	"step": 2990
	},
	{
	"epoch": 48.0,
	"learning_rate": 0.0005167741935483871,
	"loss": 0.1891,
	"step": 3000
	},
	{
	"epoch": 48.0,
	"step": 3000,
	"train_accuracy": 0.9668484050886759,
	"train_f1": 0.966687633803237,
	"train_loss": 0.09668122977018356,
	"train_precision": 0.9668284956038484,
	"train_recall": 0.9668484050886759,
	"train_runtime": 255.4386,
	"train_samples_per_second": 62.469,
	"train_steps_per_second": 0.979
	},
	{
	"epoch": 48.0,
	"eval_accuracy": 0.90304396843292,
	"eval_f1": 0.9023176970973613,
	"eval_loss": 0.40747305750846863,
	"eval_precision": 0.902276892363872,
	"eval_recall": 0.90304396843292,
	"eval_runtime": 29.6296,
	"eval_samples_per_second": 59.873,
	"eval_steps_per_second": 0.945,
	"step": 3000
	},
	{
	"epoch": 48.16,
	"learning_rate": 0.0005151612903225806,
	"loss": 0.1566,
	"step": 3010
	},
	{
	"epoch": 48.32,
	"learning_rate": 0.0005135483870967742,
	"loss": 0.1511,
	"step": 3020
	},
	{
	"epoch": 48.48,
	"learning_rate": 0.0005119354838709677,
	"loss": 0.1914,
	"step": 3030
	},
	{
	"epoch": 48.64,
	"learning_rate": 0.0005103225806451613,
	"loss": 0.1828,
	"step": 3040
	},
	{
	"epoch": 48.8,
	"learning_rate": 0.0005087096774193549,
	"loss": 0.1749,
	"step": 3050
	},
	{
	"epoch": 48.96,
	"learning_rate": 0.0005070967741935484,
	"loss": 0.1791,
	"step": 3060
	},
	{
	"epoch": 48.99,
	"step": 3062,
	"train_accuracy": 0.9676630945666479,
	"train_f1": 0.9675103889274802,
	"train_loss": 0.09363168478012085,
	"train_precision": 0.9676662039614543,
	"train_recall": 0.9676630945666479,
	"train_runtime": 255.9566,
	"train_samples_per_second": 62.343,
	"train_steps_per_second": 0.977
	},
	{
	"epoch": 48.99,
	"eval_accuracy": 0.8996617812852311,
	"eval_f1": 0.8987006309929039,
	"eval_loss": 0.4219958186149597,
	"eval_precision": 0.8986787206496698,
	"eval_recall": 0.8996617812852311,
	"eval_runtime": 29.8773,
	"eval_samples_per_second": 59.376,
	"eval_steps_per_second": 0.937,
	"step": 3062
	},
	{
	"epoch": 49.12,
	"learning_rate": 0.000505483870967742,
	"loss": 0.1666,
	"step": 3070
	},
	{
	"epoch": 49.28,
	"learning_rate": 0.0005038709677419355,
	"loss": 0.1626,
	"step": 3080
	},
	{
	"epoch": 49.44,
	"learning_rate": 0.000502258064516129,
	"loss": 0.1771,
	"step": 3090
	},
	{
	"epoch": 49.6,
	"learning_rate": 0.0005006451612903225,
	"loss": 0.179,
	"step": 3100
	},
	{
	"epoch": 49.76,
	"learning_rate": 0.0004990322580645161,
	"loss": 0.1634,
	"step": 3110
	},
	{
	"epoch": 49.92,
	"learning_rate": 0.0004974193548387097,
	"loss": 0.1702,
	"step": 3120
	},
	{
	"epoch": 50.0,
	"step": 3125,
	"train_accuracy": 0.9695431472081218,
	"train_f1": 0.9694274832881341,
	"train_loss": 0.09215661138296127,
	"train_precision": 0.9695025177310069,
	"train_recall": 0.9695431472081218,
	"train_runtime": 257.2202,
	"train_samples_per_second": 62.036,
	"train_steps_per_second": 0.972
	},
	{
	"epoch": 50.0,
	"eval_accuracy": 0.8928974069898534,
	"eval_f1": 0.8922038394852897,
	"eval_loss": 0.4357841908931732,
	"eval_precision": 0.8922256622710033,
	"eval_recall": 0.8928974069898534,
	"eval_runtime": 30.2592,
	"eval_samples_per_second": 58.627,
	"eval_steps_per_second": 0.925,
	"step": 3125
	},
	{
	"epoch": 50.08,
	"learning_rate": 0.0004958064516129032,
	"loss": 0.1738,
	"step": 3130
	},
	{
	"epoch": 50.24,
	"learning_rate": 0.0004941935483870968,
	"loss": 0.1781,
	"step": 3140
	},
	{
	"epoch": 50.4,
	"learning_rate": 0.0004925806451612903,
	"loss": 0.1814,
	"step": 3150
	},
	{
	"epoch": 50.56,
	"learning_rate": 0.0004909677419354839,
	"loss": 0.1766,
	"step": 3160
	},
	{
	"epoch": 50.72,
	"learning_rate": 0.0004893548387096775,
	"loss": 0.1689,
	"step": 3170
	},
	{
	"epoch": 50.88,
	"learning_rate": 0.00048774193548387095,
	"loss": 0.1667,
	"step": 3180
	},
	{
	"epoch": 50.99,
	"step": 3187,
	"train_accuracy": 0.9679137682521777,
	"train_f1": 0.9678451858925848,
	"train_loss": 0.08850996196269989,
	"train_precision": 0.9680124054185439,
	"train_recall": 0.9679137682521777,
	"train_runtime": 259.9309,
	"train_samples_per_second": 61.389,
	"train_steps_per_second": 0.962
	},
	{
	"epoch": 50.99,
	"eval_accuracy": 0.8957158962795941,
	"eval_f1": 0.8947220269155864,
	"eval_loss": 0.4486236274242401,
	"eval_precision": 0.8959867186310805,
	"eval_recall": 0.8957158962795941,
	"eval_runtime": 30.0872,
	"eval_samples_per_second": 58.962,
	"eval_steps_per_second": 0.931,
	"step": 3187
	},
	{
	"epoch": 51.04,
	"learning_rate": 0.00048612903225806457,
	"loss": 0.1506,
	"step": 3190
	},
	{
	"epoch": 51.2,
	"learning_rate": 0.00048451612903225807,
	"loss": 0.1555,
	"step": 3200
	},
	{
	"epoch": 51.36,
	"learning_rate": 0.00048290322580645163,
	"loss": 0.164,
	"step": 3210
	},
	{
	"epoch": 51.52,
	"learning_rate": 0.00048129032258064513,
	"loss": 0.1574,
	"step": 3220
	},
	{
	"epoch": 51.68,
	"learning_rate": 0.0004796774193548387,
	"loss": 0.1554,
	"step": 3230
	},
	{
	"epoch": 51.84,
	"learning_rate": 0.0004780645161290323,
	"loss": 0.1653,
	"step": 3240
	},
	{
	"epoch": 52.0,
	"learning_rate": 0.0004764516129032258,
	"loss": 0.1733,
	"step": 3250
	},
	{
	"epoch": 52.0,
	"step": 3250,
	"train_accuracy": 0.9680391050949426,
	"train_f1": 0.9679543842076324,
	"train_loss": 0.09445594996213913,
	"train_precision": 0.9681396256853804,
	"train_recall": 0.9680391050949426,
	"train_runtime": 256.4705,
	"train_samples_per_second": 62.218,
	"train_steps_per_second": 0.975
	},
	{
	"epoch": 52.0,
	"eval_accuracy": 0.8990980834272829,
	"eval_f1": 0.8984372111101244,
	"eval_loss": 0.43172532320022583,
	"eval_precision": 0.8994814917612028,
	"eval_recall": 0.8990980834272829,
	"eval_runtime": 29.5992,
	"eval_samples_per_second": 59.934,
	"eval_steps_per_second": 0.946,
	"step": 3250
	},
	{
	"epoch": 52.16,
	"learning_rate": 0.00047483870967741937,
	"loss": 0.1639,
	"step": 3260
	},
	{
	"epoch": 52.32,
	"learning_rate": 0.00047322580645161287,
	"loss": 0.1541,
	"step": 3270
	},
	{
	"epoch": 52.48,
	"learning_rate": 0.0004716129032258065,
	"loss": 0.1554,
	"step": 3280
	},
	{
	"epoch": 52.64,
	"learning_rate": 0.00047,
	"loss": 0.175,
	"step": 3290
	},
	{
	"epoch": 52.8,
	"learning_rate": 0.00046838709677419354,
	"loss": 0.1697,
	"step": 3300
	},
	{
	"epoch": 52.96,
	"learning_rate": 0.0004667741935483871,
	"loss": 0.1704,
	"step": 3310
	},
	{
	"epoch": 52.99,
	"step": 3312,
	"train_accuracy": 0.9716112051137432,
	"train_f1": 0.9715237218187844,
	"train_loss": 0.08361362665891647,
	"train_precision": 0.9715640137675557,
	"train_recall": 0.9716112051137432,
	"train_runtime": 251.4627,
	"train_samples_per_second": 63.457,
	"train_steps_per_second": 0.994
	},
	{
	"epoch": 52.99,
	"eval_accuracy": 0.9052987598647125,
	"eval_f1": 0.9044568554057598,
	"eval_loss": 0.41901707649230957,
	"eval_precision": 0.9045753701091548,
	"eval_recall": 0.9052987598647125,
	"eval_runtime": 29.1923,
	"eval_samples_per_second": 60.769,
	"eval_steps_per_second": 0.959,
	"step": 3312
	},
	{
	"epoch": 53.12,
	"learning_rate": 0.00046516129032258066,
	"loss": 0.1537,
	"step": 3320
	},
	{
	"epoch": 53.28,
	"learning_rate": 0.0004635483870967742,
	"loss": 0.158,
	"step": 3330
	},
	{
	"epoch": 53.44,
	"learning_rate": 0.0004619354838709677,
	"loss": 0.1493,
	"step": 3340
	},
	{
	"epoch": 53.6,
	"learning_rate": 0.0004603225806451613,
	"loss": 0.1429,
	"step": 3350
	},
	{
	"epoch": 53.76,
	"learning_rate": 0.00045870967741935484,
	"loss": 0.1628,
	"step": 3360
	},
	{
	"epoch": 53.92,
	"learning_rate": 0.0004570967741935484,
	"loss": 0.1584,
	"step": 3370
	},
	{
	"epoch": 54.0,
	"step": 3375,
	"train_accuracy": 0.9703578366860939,
	"train_f1": 0.970311857800694,
	"train_loss": 0.08544992655515671,
	"train_precision": 0.9704579277168014,
	"train_recall": 0.9703578366860939,
	"train_runtime": 251.0811,
	"train_samples_per_second": 63.553,
	"train_steps_per_second": 0.996
	},
	{
	"epoch": 54.0,
	"eval_accuracy": 0.9052987598647125,
	"eval_f1": 0.904599065142192,
	"eval_loss": 0.4305163323879242,
	"eval_precision": 0.9055272931459877,
	"eval_recall": 0.9052987598647125,
	"eval_runtime": 29.1269,
	"eval_samples_per_second": 60.906,
	"eval_steps_per_second": 0.961,
	"step": 3375
	},
	{
	"epoch": 54.08,
	"learning_rate": 0.00045548387096774196,
	"loss": 0.1577,
	"step": 3380
	},
	{
	"epoch": 54.24,
	"learning_rate": 0.00045387096774193546,
	"loss": 0.168,
	"step": 3390
	},
	{
	"epoch": 54.4,
	"learning_rate": 0.00045225806451612907,
	"loss": 0.1541,
	"step": 3400
	},
	{
	"epoch": 54.56,
	"learning_rate": 0.0004506451612903226,
	"loss": 0.1443,
	"step": 3410
	},
	{
	"epoch": 54.72,
	"learning_rate": 0.00044903225806451613,
	"loss": 0.1363,
	"step": 3420
	},
	{
	"epoch": 54.88,
	"learning_rate": 0.0004474193548387097,
	"loss": 0.1763,
	"step": 3430
	},
	{
	"epoch": 54.99,
	"step": 3437,
	"train_accuracy": 0.9722378893275678,
	"train_f1": 0.9722304845282628,
	"train_loss": 0.08548293262720108,
	"train_precision": 0.9724014188580902,
	"train_recall": 0.9722378893275678,
	"train_runtime": 250.8193,
	"train_samples_per_second": 63.62,
	"train_steps_per_second": 0.997
	},
	{
	"epoch": 54.99,
	"eval_accuracy": 0.8940248027057497,
	"eval_f1": 0.8945776482571843,
	"eval_loss": 0.4349919259548187,
	"eval_precision": 0.896683319174708,
	"eval_recall": 0.8940248027057497,
	"eval_runtime": 29.0389,
	"eval_samples_per_second": 61.09,
	"eval_steps_per_second": 0.964,
	"step": 3437
	},
	{
	"epoch": 55.04,
	"learning_rate": 0.00044580645161290325,
	"loss": 0.163,
	"step": 3440
	},
	{
	"epoch": 55.2,
	"learning_rate": 0.0004441935483870968,
	"loss": 0.1468,
	"step": 3450
	},
	{
	"epoch": 55.36,
	"learning_rate": 0.0004425806451612903,
	"loss": 0.1356,
	"step": 3460
	},
	{
	"epoch": 55.52,
	"learning_rate": 0.00044096774193548387,
	"loss": 0.1485,
	"step": 3470
	},
	{
	"epoch": 55.68,
	"learning_rate": 0.00043935483870967743,
	"loss": 0.1444,
	"step": 3480
	},
	{
	"epoch": 55.84,
	"learning_rate": 0.000437741935483871,
	"loss": 0.1463,
	"step": 3490
	},
	{
	"epoch": 56.0,
	"learning_rate": 0.00043612903225806454,
	"loss": 0.1609,
	"step": 3500
	},
	{
	"epoch": 56.0,
	"step": 3500,
	"train_accuracy": 0.9711725261640659,
	"train_f1": 0.9710418724528065,
	"train_loss": 0.08499421924352646,
	"train_precision": 0.9711871907063745,
	"train_recall": 0.9711725261640659,
	"train_runtime": 251.6401,
	"train_samples_per_second": 63.412,
	"train_steps_per_second": 0.993
	},
	{
	"epoch": 56.0,
	"eval_accuracy": 0.90304396843292,
	"eval_f1": 0.901618221901619,
	"eval_loss": 0.4472709894180298,
	"eval_precision": 0.9023465256016576,
	"eval_recall": 0.90304396843292,
	"eval_runtime": 29.9118,
	"eval_samples_per_second": 59.308,
	"eval_steps_per_second": 0.936,
	"step": 3500
	},
	{
	"epoch": 56.16,
	"learning_rate": 0.00043451612903225805,
	"loss": 0.1393,
	"step": 3510
	},
	{
	"epoch": 56.32,
	"learning_rate": 0.00043290322580645166,
	"loss": 0.1481,
	"step": 3520
	},
	{
	"epoch": 56.48,
	"learning_rate": 0.00043129032258064516,
	"loss": 0.1449,
	"step": 3530
	},
	{
	"epoch": 56.64,
	"learning_rate": 0.0004296774193548387,
	"loss": 0.168,
	"step": 3540
	},
	{
	"epoch": 56.8,
	"learning_rate": 0.0004280645161290322,
	"loss": 0.1722,
	"step": 3550
	},
	{
	"epoch": 56.96,
	"learning_rate": 0.00042645161290322584,
	"loss": 0.1549,
	"step": 3560
	},
	{
	"epoch": 56.99,
	"step": 3562,
	"train_accuracy": 0.9697311524722693,
	"train_f1": 0.96954160239289,
	"train_loss": 0.0850997045636177,
	"train_precision": 0.9698850921890346,
	"train_recall": 0.9697311524722693,
	"train_runtime": 250.5824,
	"train_samples_per_second": 63.68,
	"train_steps_per_second": 0.998
	},
	{
	"epoch": 56.99,
	"eval_accuracy": 0.9041713641488163,
	"eval_f1": 0.9027359585690536,
	"eval_loss": 0.4477776885032654,
	"eval_precision": 0.9037863994127037,
	"eval_recall": 0.9041713641488163,
	"eval_runtime": 29.1274,
	"eval_samples_per_second": 60.905,
	"eval_steps_per_second": 0.961,
	"step": 3562
	},
	{
	"epoch": 57.12,
	"learning_rate": 0.0004248387096774194,
	"loss": 0.1415,
	"step": 3570
	},
	{
	"epoch": 57.28,
	"learning_rate": 0.0004232258064516129,
	"loss": 0.1557,
	"step": 3580
	},
	{
	"epoch": 57.44,
	"learning_rate": 0.00042161290322580646,
	"loss": 0.143,
	"step": 3590
	},
	{
	"epoch": 57.6,
	"learning_rate": 0.00042,
	"loss": 0.154,
	"step": 3600
	},
	{
	"epoch": 57.76,
	"learning_rate": 0.0004183870967741936,
	"loss": 0.1325,
	"step": 3610
	},
	{
	"epoch": 57.92,
	"learning_rate": 0.0004167741935483871,
	"loss": 0.1586,
	"step": 3620
	},
	{
	"epoch": 58.0,
	"step": 3625,
	"train_accuracy": 0.9711098577426834,
	"train_f1": 0.9710190406318763,
	"train_loss": 0.08111045509576797,
	"train_precision": 0.971108783894692,
	"train_recall": 0.9711098577426834,
	"train_runtime": 252.5322,
	"train_samples_per_second": 63.188,
	"train_steps_per_second": 0.99
	},
	{
	"epoch": 58.0,
	"eval_accuracy": 0.9024802705749718,
	"eval_f1": 0.9011546163080018,
	"eval_loss": 0.4446905255317688,
	"eval_precision": 0.9024443209930092,
	"eval_recall": 0.9024802705749718,
	"eval_runtime": 29.4234,
	"eval_samples_per_second": 60.292,
	"eval_steps_per_second": 0.952,
	"step": 3625
	},
	{
	"epoch": 58.08,
	"learning_rate": 0.00041516129032258064,
	"loss": 0.1589,
	"step": 3630
	},
	{
	"epoch": 58.24,
	"learning_rate": 0.00041354838709677425,
	"loss": 0.1368,
	"step": 3640
	},
	{
	"epoch": 58.4,
	"learning_rate": 0.00041193548387096775,
	"loss": 0.135,
	"step": 3650
	},
	{
	"epoch": 58.56,
	"learning_rate": 0.0004103225806451613,
	"loss": 0.1393,
	"step": 3660
	},
	{
	"epoch": 58.72,
	"learning_rate": 0.0004087096774193548,
	"loss": 0.1414,
	"step": 3670
	},
	{
	"epoch": 58.88,
	"learning_rate": 0.00040709677419354843,
	"loss": 0.1476,
	"step": 3680
	},
	{
	"epoch": 58.99,
	"step": 3687,
	"train_accuracy": 0.9716738735351257,
	"train_f1": 0.9716109081205196,
	"train_loss": 0.08109210431575775,
	"train_precision": 0.971619589233349,
	"train_recall": 0.9716738735351257,
	"train_runtime": 251.3717,
	"train_samples_per_second": 63.48,
	"train_steps_per_second": 0.995
	},
	{
	"epoch": 58.99,
	"eval_accuracy": 0.9007891770011274,
	"eval_f1": 0.8998310286529279,
	"eval_loss": 0.46749255061149597,
	"eval_precision": 0.9005611855026796,
	"eval_recall": 0.9007891770011274,
	"eval_runtime": 29.4648,
	"eval_samples_per_second": 60.207,
	"eval_steps_per_second": 0.95,
	"step": 3687
	},
	{
	"epoch": 59.04,
	"learning_rate": 0.00040548387096774193,
	"loss": 0.1469,
	"step": 3690
	},
	{
	"epoch": 59.2,
	"learning_rate": 0.0004038709677419355,
	"loss": 0.1285,
	"step": 3700
	},
	{
	"epoch": 59.36,
	"learning_rate": 0.00040225806451612905,
	"loss": 0.1543,
	"step": 3710
	},
	{
	"epoch": 59.52,
	"learning_rate": 0.00040064516129032255,
	"loss": 0.1576,
	"step": 3720
	},
	{
	"epoch": 59.68,
	"learning_rate": 0.00039903225806451616,
	"loss": 0.1639,
	"step": 3730
	},
	{
	"epoch": 59.84,
	"learning_rate": 0.00039741935483870967,
	"loss": 0.1602,
	"step": 3740
	},
	{
	"epoch": 60.0,
	"learning_rate": 0.0003958064516129032,
	"loss": 0.1308,
	"step": 3750
	},
	{
	"epoch": 60.0,
	"step": 3750,
	"train_accuracy": 0.9714231998495958,
	"train_f1": 0.9713301650863866,
	"train_loss": 0.08129285275936127,
	"train_precision": 0.9713703959271734,
	"train_recall": 0.9714231998495958,
	"train_runtime": 251.5017,
	"train_samples_per_second": 63.447,
	"train_steps_per_second": 0.994
	},
	{
	"epoch": 60.0,
	"eval_accuracy": 0.9047350620067643,
	"eval_f1": 0.9038436882672473,
	"eval_loss": 0.4706019163131714,
	"eval_precision": 0.9044402371933982,
	"eval_recall": 0.9047350620067643,
	"eval_runtime": 30.419,
	"eval_samples_per_second": 58.319,
	"eval_steps_per_second": 0.92,
	"step": 3750
	},
	{
	"epoch": 60.16,
	"learning_rate": 0.00039419354838709673,
	"loss": 0.1425,
	"step": 3760
	},
	{
	"epoch": 60.32,
	"learning_rate": 0.00039258064516129034,
	"loss": 0.1372,
	"step": 3770
	},
	{
	"epoch": 60.48,
	"learning_rate": 0.0003909677419354839,
	"loss": 0.1429,
	"step": 3780
	},
	{
	"epoch": 60.64,
	"learning_rate": 0.0003893548387096774,
	"loss": 0.1366,
	"step": 3790
	},
	{
	"epoch": 60.8,
	"learning_rate": 0.00038774193548387096,
	"loss": 0.1503,
	"step": 3800
	},
	{
	"epoch": 60.96,
	"learning_rate": 0.0003861290322580645,
	"loss": 0.1558,
	"step": 3810
	},
	{
	"epoch": 60.99,
	"step": 3812,
	"train_accuracy": 0.9736165945979821,
	"train_f1": 0.9735015663251901,
	"train_loss": 0.07483678311109543,
	"train_precision": 0.9736053164344912,
	"train_recall": 0.9736165945979821,
	"train_runtime": 250.9181,
	"train_samples_per_second": 63.594,
	"train_steps_per_second": 0.996
	},
	{
	"epoch": 60.99,
	"eval_accuracy": 0.9024802705749718,
	"eval_f1": 0.9010669627888577,
	"eval_loss": 0.45878297090530396,
	"eval_precision": 0.9016661622070999,
	"eval_recall": 0.9024802705749718,
	"eval_runtime": 30.1022,
	"eval_samples_per_second": 58.933,
	"eval_steps_per_second": 0.93,
	"step": 3812
	},
	{
	"epoch": 61.12,
	"learning_rate": 0.0003845161290322581,
	"loss": 0.1222,
	"step": 3820
	},
	{
	"epoch": 61.28,
	"learning_rate": 0.0003829032258064516,
	"loss": 0.1555,
	"step": 3830
	},
	{
	"epoch": 61.44,
	"learning_rate": 0.00038129032258064514,
	"loss": 0.1306,
	"step": 3840
	},
	{
	"epoch": 61.6,
	"learning_rate": 0.00037967741935483875,
	"loss": 0.1618,
	"step": 3850
	},
	{
	"epoch": 61.76,
	"learning_rate": 0.00037806451612903226,
	"loss": 0.1436,
	"step": 3860
	},
	{
	"epoch": 61.92,
	"learning_rate": 0.0003764516129032258,
	"loss": 0.1418,
	"step": 3870
	},
	{
	"epoch": 62.0,
	"step": 3875,
	"train_accuracy": 0.9729899103841574,
	"train_f1": 0.9729148616100128,
	"train_loss": 0.07707332819700241,
	"train_precision": 0.9730221901785945,
	"train_recall": 0.9729899103841574,
	"train_runtime": 254.0917,
	"train_samples_per_second": 62.8,
	"train_steps_per_second": 0.984
	},
	{
	"epoch": 62.0,
	"eval_accuracy": 0.9013528748590756,
	"eval_f1": 0.9008617353869077,
	"eval_loss": 0.4513218104839325,
	"eval_precision": 0.9012600116180024,
	"eval_recall": 0.9013528748590756,
	"eval_runtime": 29.9385,
	"eval_samples_per_second": 59.255,
	"eval_steps_per_second": 0.935,
	"step": 3875
	},
	{
	"epoch": 62.08,
	"learning_rate": 0.0003748387096774193,
	"loss": 0.173,
	"step": 3880
	},
	{
	"epoch": 62.24,
	"learning_rate": 0.00037322580645161293,
	"loss": 0.1304,
	"step": 3890
	},
	{
	"epoch": 62.4,
	"learning_rate": 0.0003716129032258065,
	"loss": 0.1579,
	"step": 3900
	},
	{
	"epoch": 62.56,
	"learning_rate": 0.00037,
	"loss": 0.1388,
	"step": 3910
	},
	{
	"epoch": 62.72,
	"learning_rate": 0.00036838709677419355,
	"loss": 0.152,
	"step": 3920
	},
	{
	"epoch": 62.88,
	"learning_rate": 0.0003667741935483871,
	"loss": 0.1283,
	"step": 3930
	},
	{
	"epoch": 62.99,
	"step": 3937,
	"train_accuracy": 0.9760606630318982,
	"train_f1": 0.9759960239064865,
	"train_loss": 0.07244587689638138,
	"train_precision": 0.9760629730336429,
	"train_recall": 0.9760606630318982,
	"train_runtime": 252.7156,
	"train_samples_per_second": 63.142,
	"train_steps_per_second": 0.989
	},
	{
	"epoch": 62.99,
	"eval_accuracy": 0.8990980834272829,
	"eval_f1": 0.8976577160373229,
	"eval_loss": 0.46622931957244873,
	"eval_precision": 0.8981920636717567,
	"eval_recall": 0.8990980834272829,
	"eval_runtime": 30.0055,
	"eval_samples_per_second": 59.122,
	"eval_steps_per_second": 0.933,
	"step": 3937
	},
	{
	"epoch": 63.04,
	"learning_rate": 0.00036516129032258067,
	"loss": 0.1423,
	"step": 3940
	},
	{
	"epoch": 63.2,
	"learning_rate": 0.0003635483870967742,
	"loss": 0.1345,
	"step": 3950
	},
	{
	"epoch": 63.36,
	"learning_rate": 0.00036193548387096773,
	"loss": 0.1225,
	"step": 3960
	},
	{
	"epoch": 63.52,
	"learning_rate": 0.00036032258064516134,
	"loss": 0.1399,
	"step": 3970
	},
	{
	"epoch": 63.68,
	"learning_rate": 0.00035870967741935485,
	"loss": 0.1409,
	"step": 3980
	},
	{
	"epoch": 63.84,
	"learning_rate": 0.0003570967741935484,
	"loss": 0.1431,
	"step": 3990
	},
	{
	"epoch": 64.0,
	"learning_rate": 0.0003554838709677419,
	"loss": 0.1375,
	"step": 4000
	},
	{
	"epoch": 64.0,
	"step": 4000,
	"train_accuracy": 0.9777527104092248,
	"train_f1": 0.9776952189068061,
	"train_loss": 0.07026933133602142,
	"train_precision": 0.9777982624530956,
	"train_recall": 0.9777527104092248,
	"train_runtime": 254.2798,
	"train_samples_per_second": 62.754,
	"train_steps_per_second": 0.983
	},
	{
	"epoch": 64.0,
	"eval_accuracy": 0.90304396843292,
	"eval_f1": 0.9018013838304384,
	"eval_loss": 0.43738722801208496,
	"eval_precision": 0.9018869567596777,
	"eval_recall": 0.90304396843292,
	"eval_runtime": 30.384,
	"eval_samples_per_second": 58.386,
	"eval_steps_per_second": 0.922,
	"step": 4000
	},
	{
	"epoch": 64.16,
	"learning_rate": 0.0003538709677419355,
	"loss": 0.121,
	"step": 4010
	},
	{
	"epoch": 64.32,
	"learning_rate": 0.000352258064516129,
	"loss": 0.1532,
	"step": 4020
	},
	{
	"epoch": 64.48,
	"learning_rate": 0.0003506451612903226,
	"loss": 0.1307,
	"step": 4030
	},
	{
	"epoch": 64.64,
	"learning_rate": 0.00034903225806451614,
	"loss": 0.1403,
	"step": 4040
	},
	{
	"epoch": 64.8,
	"learning_rate": 0.0003474193548387097,
	"loss": 0.1467,
	"step": 4050
	},
	{
	"epoch": 64.96,
	"learning_rate": 0.00034580645161290326,
	"loss": 0.1255,
	"step": 4060
	},
	{
	"epoch": 64.99,
	"step": 4062,
	"train_accuracy": 0.9758099893463683,
	"train_f1": 0.9757450720707583,
	"train_loss": 0.0738762691617012,
	"train_precision": 0.9758253961539621,
	"train_recall": 0.9758099893463683,
	"train_runtime": 270.7799,
	"train_samples_per_second": 58.93,
	"train_steps_per_second": 0.923
	},
	{
	"epoch": 64.99,
	"eval_accuracy": 0.9041713641488163,
	"eval_f1": 0.9027682806702938,
	"eval_loss": 0.43671032786369324,
	"eval_precision": 0.9029520225388282,
	"eval_recall": 0.9041713641488163,
	"eval_runtime": 46.2,
	"eval_samples_per_second": 38.398,
	"eval_steps_per_second": 0.606,
	"step": 4062
	},
	{
	"epoch": 65.12,
	"learning_rate": 0.00034419354838709676,
	"loss": 0.1398,
	"step": 4070
	},
	{
	"epoch": 65.28,
	"learning_rate": 0.0003425806451612903,
	"loss": 0.1294,
	"step": 4080
	},
	{
	"epoch": 65.44,
	"learning_rate": 0.0003409677419354839,
	"loss": 0.1192,
	"step": 4090
	},
	{
	"epoch": 65.6,
	"learning_rate": 0.00033935483870967744,
	"loss": 0.1274,
	"step": 4100
	},
	{
	"epoch": 65.76,
	"learning_rate": 0.000337741935483871,
	"loss": 0.1332,
	"step": 4110
	},
	{
	"epoch": 65.92,
	"learning_rate": 0.0003361290322580645,
	"loss": 0.1356,
	"step": 4120
	},
	{
	"epoch": 66.0,
	"step": 4125,
	"train_accuracy": 0.9761233314532807,
	"train_f1": 0.9759950169974181,
	"train_loss": 0.07223277539014816,
	"train_precision": 0.9761999631640097,
	"train_recall": 0.9761233314532807,
	"train_runtime": 254.9857,
	"train_samples_per_second": 62.58,
	"train_steps_per_second": 0.98
	},
	{
	"epoch": 66.0,
	"eval_accuracy": 0.9002254791431793,
	"eval_f1": 0.8985023992882097,
	"eval_loss": 0.47199180722236633,
	"eval_precision": 0.8998740225780659,
	"eval_recall": 0.9002254791431793,
	"eval_runtime": 46.4259,
	"eval_samples_per_second": 38.211,
	"eval_steps_per_second": 0.603,
	"step": 4125
	},
	{
	"epoch": 66.08,
	"learning_rate": 0.0003345161290322581,
	"loss": 0.1288,
	"step": 4130
	},
	{
	"epoch": 66.24,
	"learning_rate": 0.0003329032258064516,
	"loss": 0.1373,
	"step": 4140
	},
	{
	"epoch": 66.4,
	"learning_rate": 0.0003312903225806452,
	"loss": 0.1424,
	"step": 4150
	},
	{
	"epoch": 66.56,
	"learning_rate": 0.0003296774193548387,
	"loss": 0.1369,
	"step": 4160
	},
	{
	"epoch": 66.72,
	"learning_rate": 0.0003280645161290323,
	"loss": 0.1366,
	"step": 4170
	},
	{
	"epoch": 66.88,
	"learning_rate": 0.00032645161290322585,
	"loss": 0.1363,
	"step": 4180
	},
	{
	"epoch": 66.99,
	"step": 4187,
	"train_accuracy": 0.9745566209187191,
	"train_f1": 0.9744197447101088,
	"train_loss": 0.07206864655017853,
	"train_precision": 0.9746863463745119,
	"train_recall": 0.9745566209187191,
	"train_runtime": 255.3323,
	"train_samples_per_second": 62.495,
	"train_steps_per_second": 0.979
	},
	{
	"epoch": 66.99,
	"eval_accuracy": 0.8974069898534386,
	"eval_f1": 0.8958287812129277,
	"eval_loss": 0.4912644624710083,
	"eval_precision": 0.897064496045103,
	"eval_recall": 0.8974069898534386,
	"eval_runtime": 42.5384,
	"eval_samples_per_second": 41.703,
	"eval_steps_per_second": 0.658,
	"step": 4187
	},
	{
	"epoch": 67.04,
	"learning_rate": 0.00032483870967741935,
	"loss": 0.1427,
	"step": 4190
	},
	{
	"epoch": 67.2,
	"learning_rate": 0.0003232258064516129,
	"loss": 0.1423,
	"step": 4200
	},
	{
	"epoch": 67.36,
	"learning_rate": 0.00032161290322580647,
	"loss": 0.1346,
	"step": 4210
	},
	{
	"epoch": 67.52,
	"learning_rate": 0.00032,
	"loss": 0.1349,
	"step": 4220
	},
	{
	"epoch": 67.68,
	"learning_rate": 0.00031838709677419353,
	"loss": 0.1222,
	"step": 4230
	},
	{
	"epoch": 67.84,
	"learning_rate": 0.0003167741935483871,
	"loss": 0.1332,
	"step": 4240
	},
	{
	"epoch": 68.0,
	"learning_rate": 0.0003151612903225807,
	"loss": 0.1307,
	"step": 4250
	},
	{
	"epoch": 68.0,
	"step": 4250,
	"train_accuracy": 0.9771260261954001,
	"train_f1": 0.9770837683590446,
	"train_loss": 0.06861759722232819,
	"train_precision": 0.9771261688994373,
	"train_recall": 0.9771260261954001,
	"train_runtime": 258.9242,
	"train_samples_per_second": 61.628,
	"train_steps_per_second": 0.966
	},
	{
	"epoch": 68.0,
	"eval_accuracy": 0.9041713641488163,
	"eval_f1": 0.9032565731221586,
	"eval_loss": 0.440946489572525,
	"eval_precision": 0.9031641144165843,
	"eval_recall": 0.9041713641488163,
	"eval_runtime": 39.476,
	"eval_samples_per_second": 44.939,
	"eval_steps_per_second": 0.709,
	"step": 4250
	},
	{
	"epoch": 68.16,
	"learning_rate": 0.0003135483870967742,
	"loss": 0.1264,
	"step": 4260
	},
	{
	"epoch": 68.32,
	"learning_rate": 0.00031193548387096776,
	"loss": 0.1441,
	"step": 4270
	},
	{
	"epoch": 68.48,
	"learning_rate": 0.00031032258064516127,
	"loss": 0.127,
	"step": 4280
	},
	{
	"epoch": 68.64,
	"learning_rate": 0.0003087096774193548,
	"loss": 0.1392,
	"step": 4290
	},
	{
	"epoch": 68.8,
	"learning_rate": 0.0003070967741935484,
	"loss": 0.143,
	"step": 4300
	},
	{
	"epoch": 68.96,
	"learning_rate": 0.00030548387096774194,
	"loss": 0.1209,
	"step": 4310
	},
	{
	"epoch": 68.99,
	"step": 4312,
	"train_accuracy": 0.975621984082221,
	"train_f1": 0.9755696733303983,
	"train_loss": 0.07073085755109787,
	"train_precision": 0.9756366046304416,
	"train_recall": 0.975621984082221,
	"train_runtime": 256.8947,
	"train_samples_per_second": 62.115,
	"train_steps_per_second": 0.973
	},
	{
	"epoch": 68.99,
	"eval_accuracy": 0.9075535512965051,
	"eval_f1": 0.9068001649833212,
	"eval_loss": 0.4593234956264496,
	"eval_precision": 0.9074473642395492,
	"eval_recall": 0.9075535512965051,
	"eval_runtime": 44.7864,
	"eval_samples_per_second": 39.61,
	"eval_steps_per_second": 0.625,
	"step": 4312
	},
	{
	"epoch": 69.12,
	"learning_rate": 0.0003038709677419355,
	"loss": 0.1404,
	"step": 4320
	},
	{
	"epoch": 69.28,
	"learning_rate": 0.000302258064516129,
	"loss": 0.1417,
	"step": 4330
	},
	{
	"epoch": 69.44,
	"learning_rate": 0.0003006451612903226,
	"loss": 0.1137,
	"step": 4340
	},
	{
	"epoch": 69.6,
	"learning_rate": 0.0002990322580645161,
	"loss": 0.118,
	"step": 4350
	},
	{
	"epoch": 69.76,
	"learning_rate": 0.0002974193548387097,
	"loss": 0.1159,
	"step": 4360
	},
	{
	"epoch": 69.92,
	"learning_rate": 0.0002958064516129032,
	"loss": 0.1463,
	"step": 4370
	},
	{
	"epoch": 70.0,
	"step": 4375,
	"train_accuracy": 0.9780660525161371,
	"train_f1": 0.9780045954132663,
	"train_loss": 0.06600172072649002,
	"train_precision": 0.9780539223141508,
	"train_recall": 0.9780660525161371,
	"train_runtime": 257.4363,
	"train_samples_per_second": 61.984,
	"train_steps_per_second": 0.971
	},
	{
	"epoch": 70.0,
	"eval_accuracy": 0.9036076662908681,
	"eval_f1": 0.9023949767425765,
	"eval_loss": 0.4772753119468689,
	"eval_precision": 0.9028653821326578,
	"eval_recall": 0.9036076662908681,
	"eval_runtime": 40.3083,
	"eval_samples_per_second": 44.011,
	"eval_steps_per_second": 0.695,
	"step": 4375
	},
	{
	"epoch": 70.08,
	"learning_rate": 0.0002941935483870968,
	"loss": 0.1154,
	"step": 4380
	},
	{
	"epoch": 70.24,
	"learning_rate": 0.00029258064516129035,
	"loss": 0.1401,
	"step": 4390
	},
	{
	"epoch": 70.4,
	"learning_rate": 0.00029096774193548386,
	"loss": 0.1348,
	"step": 4400
	},
	{
	"epoch": 70.56,
	"learning_rate": 0.0002893548387096774,
	"loss": 0.1333,
	"step": 4410
	},
	{
	"epoch": 70.72,
	"learning_rate": 0.00028774193548387097,
	"loss": 0.1292,
	"step": 4420
	},
	{
	"epoch": 70.88,
	"learning_rate": 0.00028612903225806453,
	"loss": 0.1217,
	"step": 4430
	},
	{
	"epoch": 70.99,
	"step": 4437,
	"train_accuracy": 0.976562010402958,
	"train_f1": 0.976489238828708,
	"train_loss": 0.0662013366818428,
	"train_precision": 0.9765934380829007,
	"train_recall": 0.976562010402958,
	"train_runtime": 257.6318,
	"train_samples_per_second": 61.937,
	"train_steps_per_second": 0.97
	},
	{
	"epoch": 70.99,
	"eval_accuracy": 0.9098083427282976,
	"eval_f1": 0.9089720394690067,
	"eval_loss": 0.44329407811164856,
	"eval_precision": 0.9092946695808038,
	"eval_recall": 0.9098083427282976,
	"eval_runtime": 34.2569,
	"eval_samples_per_second": 51.785,
	"eval_steps_per_second": 0.817,
	"step": 4437
	},
	{
	"epoch": 71.04,
	"learning_rate": 0.0002845161290322581,
	"loss": 0.1271,
	"step": 4440
	},
	{
	"epoch": 71.2,
	"learning_rate": 0.0002829032258064516,
	"loss": 0.1108,
	"step": 4450
	},
	{
	"epoch": 71.36,
	"learning_rate": 0.0002812903225806452,
	"loss": 0.1156,
	"step": 4460
	},
	{
	"epoch": 71.52,
	"learning_rate": 0.0002796774193548387,
	"loss": 0.1385,
	"step": 4470
	},
	{
	"epoch": 71.68,
	"learning_rate": 0.00027806451612903227,
	"loss": 0.1333,
	"step": 4480
	},
	{
	"epoch": 71.84,
	"learning_rate": 0.00027645161290322577,
	"loss": 0.107,
	"step": 4490
	},
	{
	"epoch": 72.0,
	"learning_rate": 0.0002748387096774194,
	"loss": 0.1361,
	"step": 4500
	},
	{
	"epoch": 72.0,
	"step": 4500,
	"train_accuracy": 0.9758726577677508,
	"train_f1": 0.9758377736683368,
	"train_loss": 0.0710226520895958,
	"train_precision": 0.9758628894264394,
	"train_recall": 0.9758726577677508,
	"train_runtime": 260.0539,
	"train_samples_per_second": 61.36,
	"train_steps_per_second": 0.961
	},
	{
	"epoch": 72.0,
	"eval_accuracy": 0.9075535512965051,
	"eval_f1": 0.9071424091130842,
	"eval_loss": 0.43427780270576477,
	"eval_precision": 0.907402566021774,
	"eval_recall": 0.9075535512965051,
	"eval_runtime": 30.9428,
	"eval_samples_per_second": 57.332,
	"eval_steps_per_second": 0.905,
	"step": 4500
	},
	{
	"epoch": 72.16,
	"learning_rate": 0.00027322580645161294,
	"loss": 0.1166,
	"step": 4510
	},
	{
	"epoch": 72.32,
	"learning_rate": 0.00027161290322580645,
	"loss": 0.1422,
	"step": 4520
	},
	{
	"epoch": 72.48,
	"learning_rate": 0.00027,
	"loss": 0.1253,
	"step": 4530
	},
	{
	"epoch": 72.64,
	"learning_rate": 0.00026838709677419356,
	"loss": 0.1287,
	"step": 4540
	},
	{
	"epoch": 72.8,
	"learning_rate": 0.0002667741935483871,
	"loss": 0.1257,
	"step": 4550
	},
	{
	"epoch": 72.96,
	"learning_rate": 0.0002651612903225806,
	"loss": 0.1164,
	"step": 4560
	},
	{
	"epoch": 72.99,
	"step": 4562,
	"train_accuracy": 0.9780660525161371,
	"train_f1": 0.9780243494069962,
	"train_loss": 0.0632663145661354,
	"train_precision": 0.978042686088855,
	"train_recall": 0.9780660525161371,
	"train_runtime": 253.9785,
	"train_samples_per_second": 62.828,
	"train_steps_per_second": 0.984
	},
	{
	"epoch": 72.99,
	"eval_accuracy": 0.9013528748590756,
	"eval_f1": 0.90025705081473,
	"eval_loss": 0.4536808431148529,
	"eval_precision": 0.9003205156911865,
	"eval_recall": 0.9013528748590756,
	"eval_runtime": 30.6887,
	"eval_samples_per_second": 57.806,
	"eval_steps_per_second": 0.912,
	"step": 4562
	},
	{
	"epoch": 73.12,
	"learning_rate": 0.0002635483870967742,
	"loss": 0.1255,
	"step": 4570
	},
	{
	"epoch": 73.28,
	"learning_rate": 0.0002619354838709678,
	"loss": 0.1278,
	"step": 4580
	},
	{
	"epoch": 73.44,
	"learning_rate": 0.0002603225806451613,
	"loss": 0.1296,
	"step": 4590
	},
	{
	"epoch": 73.6,
	"learning_rate": 0.00025870967741935486,
	"loss": 0.1337,
	"step": 4600
	},
	{
	"epoch": 73.76,
	"learning_rate": 0.00025709677419354836,
	"loss": 0.1215,
	"step": 4610
	},
	{
	"epoch": 73.92,
	"learning_rate": 0.00025548387096774197,
	"loss": 0.1313,
	"step": 4620
	},
	{
	"epoch": 74.0,
	"step": 4625,
	"train_accuracy": 0.9766246788243405,
	"train_f1": 0.9765319317829301,
	"train_loss": 0.06763936579227448,
	"train_precision": 0.976670123477298,
	"train_recall": 0.9766246788243405,
	"train_runtime": 252.1633,
	"train_samples_per_second": 63.28,
	"train_steps_per_second": 0.991
	},
	{
	"epoch": 74.0,
	"eval_accuracy": 0.90304396843292,
	"eval_f1": 0.9020628517400072,
	"eval_loss": 0.44354888796806335,
	"eval_precision": 0.9022087129927616,
	"eval_recall": 0.90304396843292,
	"eval_runtime": 29.2384,
	"eval_samples_per_second": 60.674,
	"eval_steps_per_second": 0.958,
	"step": 4625
	},
	{
	"epoch": 74.08,
	"learning_rate": 0.0002538709677419355,
	"loss": 0.1295,
	"step": 4630
	},
	{
	"epoch": 74.24,
	"learning_rate": 0.00025225806451612903,
	"loss": 0.1257,
	"step": 4640
	},
	{
	"epoch": 74.4,
	"learning_rate": 0.0002506451612903226,
	"loss": 0.1009,
	"step": 4650
	},
	{
	"epoch": 74.56,
	"learning_rate": 0.00024903225806451615,
	"loss": 0.1254,
	"step": 4660
	},
	{
	"epoch": 74.72,
	"learning_rate": 0.00024741935483870965,
	"loss": 0.1291,
	"step": 4670
	},
	{
	"epoch": 74.88,
	"learning_rate": 0.00024580645161290327,
	"loss": 0.1291,
	"step": 4680
	},
	{
	"epoch": 74.99,
	"step": 4687,
	"train_accuracy": 0.97737669988093,
	"train_f1": 0.9773174710084362,
	"train_loss": 0.06480351090431213,
	"train_precision": 0.9773832839286731,
	"train_recall": 0.97737669988093,
	"train_runtime": 266.3469,
	"train_samples_per_second": 59.911,
	"train_steps_per_second": 0.939
	},
	{
	"epoch": 74.99,
	"eval_accuracy": 0.9052987598647125,
	"eval_f1": 0.9045329930179677,
	"eval_loss": 0.44802290201187134,
	"eval_precision": 0.9044815010640291,
	"eval_recall": 0.9052987598647125,
	"eval_runtime": 46.7594,
	"eval_samples_per_second": 37.939,
	"eval_steps_per_second": 0.599,
	"step": 4687
	},
	{
	"epoch": 75.04,
	"learning_rate": 0.00024419354838709677,
	"loss": 0.1316,
	"step": 4690
	},
	{
	"epoch": 75.2,
	"learning_rate": 0.00024258064516129033,
	"loss": 0.1315,
	"step": 4700
	},
	{
	"epoch": 75.36,
	"learning_rate": 0.0002409677419354839,
	"loss": 0.11,
	"step": 4710
	},
	{
	"epoch": 75.52,
	"learning_rate": 0.00023935483870967742,
	"loss": 0.1253,
	"step": 4720
	},
	{
	"epoch": 75.68,
	"learning_rate": 0.00023774193548387098,
	"loss": 0.1193,
	"step": 4730
	},
	{
	"epoch": 75.84,
	"learning_rate": 0.0002361290322580645,
	"loss": 0.1122,
	"step": 4740
	},
	{
	"epoch": 76.0,
	"learning_rate": 0.0002345161290322581,
	"loss": 0.132,
	"step": 4750
	},
	{
	"epoch": 76.0,
	"step": 4750,
	"train_accuracy": 0.9790060788368741,
	"train_f1": 0.9789581823313721,
	"train_loss": 0.060503240674734116,
	"train_precision": 0.9790325316940118,
	"train_recall": 0.9790060788368741,
	"train_runtime": 258.2855,
	"train_samples_per_second": 61.78,
	"train_steps_per_second": 0.968
	},
	{
	"epoch": 76.0,
	"eval_accuracy": 0.9058624577226606,
	"eval_f1": 0.904482480434317,
	"eval_loss": 0.46171513199806213,
	"eval_precision": 0.9050040535484158,
	"eval_recall": 0.9058624577226606,
	"eval_runtime": 42.9199,
	"eval_samples_per_second": 41.333,
	"eval_steps_per_second": 0.652,
	"step": 4750
	},
	{
	"epoch": 76.16,
	"learning_rate": 0.00023290322580645162,
	"loss": 0.1141,
	"step": 4760
	},
	{
	"epoch": 76.32,
	"learning_rate": 0.00023129032258064516,
	"loss": 0.111,
	"step": 4770
	},
	{
	"epoch": 76.48,
	"learning_rate": 0.0002296774193548387,
	"loss": 0.1362,
	"step": 4780
	},
	{
	"epoch": 76.64,
	"learning_rate": 0.00022806451612903224,
	"loss": 0.1303,
	"step": 4790
	},
	{
	"epoch": 76.8,
	"learning_rate": 0.0002264516129032258,
	"loss": 0.1128,
	"step": 4800
	},
	{
	"epoch": 76.96,
	"learning_rate": 0.00022483870967741936,
	"loss": 0.1197,
	"step": 4810
	},
	{
	"epoch": 76.99,
	"step": 4812,
	"train_accuracy": 0.9780033840947546,
	"train_f1": 0.9779246149243382,
	"train_loss": 0.06653548032045364,
	"train_precision": 0.9780194906548296,
	"train_recall": 0.9780033840947546,
	"train_runtime": 255.9446,
	"train_samples_per_second": 62.346,
	"train_steps_per_second": 0.977
	},
	{
	"epoch": 76.99,
	"eval_accuracy": 0.9058624577226606,
	"eval_f1": 0.904136777153852,
	"eval_loss": 0.45922645926475525,
	"eval_precision": 0.9042117586049208,
	"eval_recall": 0.9058624577226606,
	"eval_runtime": 37.615,
	"eval_samples_per_second": 47.162,
	"eval_steps_per_second": 0.744,
	"step": 4812
	},
	{
	"epoch": 77.12,
	"learning_rate": 0.00022322580645161292,
	"loss": 0.1185,
	"step": 4820
	},
	{
	"epoch": 77.28,
	"learning_rate": 0.00022161290322580645,
	"loss": 0.1297,
	"step": 4830
	},
	{
	"epoch": 77.44,
	"learning_rate": 0.00022,
	"loss": 0.1167,
	"step": 4840
	},
	{
	"epoch": 77.6,
	"learning_rate": 0.00021838709677419354,
	"loss": 0.1185,
	"step": 4850
	},
	{
	"epoch": 77.76,
	"learning_rate": 0.0002167741935483871,
	"loss": 0.1095,
	"step": 4860
	},
	{
	"epoch": 77.92,
	"learning_rate": 0.00021516129032258063,
	"loss": 0.1199,
	"step": 4870
	},
	{
	"epoch": 78.0,
	"step": 4875,
	"train_accuracy": 0.9789434104154916,
	"train_f1": 0.9789055395945256,
	"train_loss": 0.06331050395965576,
	"train_precision": 0.9789060427186901,
	"train_recall": 0.9789434104154916,
	"train_runtime": 255.8602,
	"train_samples_per_second": 62.366,
	"train_steps_per_second": 0.977
	},
	{
	"epoch": 78.0,
	"eval_accuracy": 0.9160090191657272,
	"eval_f1": 0.9156304372279399,
	"eval_loss": 0.4329167902469635,
	"eval_precision": 0.9156707582414666,
	"eval_recall": 0.9160090191657272,
	"eval_runtime": 36.868,
	"eval_samples_per_second": 48.118,
	"eval_steps_per_second": 0.759,
	"step": 4875
	},
	{
	"epoch": 78.08,
	"learning_rate": 0.0002135483870967742,
	"loss": 0.1098,
	"step": 4880
	},
	{
	"epoch": 78.24,
	"learning_rate": 0.00021193548387096774,
	"loss": 0.1134,
	"step": 4890
	},
	{
	"epoch": 78.4,
	"learning_rate": 0.0002103225806451613,
	"loss": 0.1103,
	"step": 4900
	},
	{
	"epoch": 78.56,
	"learning_rate": 0.00020870967741935483,
	"loss": 0.1266,
	"step": 4910
	},
	{
	"epoch": 78.72,
	"learning_rate": 0.0002070967741935484,
	"loss": 0.1083,
	"step": 4920
	},
	{
	"epoch": 78.88,
	"learning_rate": 0.00020548387096774192,
	"loss": 0.124,
	"step": 4930
	},
	{
	"epoch": 78.99,
	"step": 4937,
	"train_accuracy": 0.978191389358902,
	"train_f1": 0.9781684943478942,
	"train_loss": 0.06074240058660507,
	"train_precision": 0.9782183084448501,
	"train_recall": 0.978191389358902,
	"train_runtime": 255.7407,
	"train_samples_per_second": 62.395,
	"train_steps_per_second": 0.978
	},
	{
	"epoch": 78.99,
	"eval_accuracy": 0.9148816234498309,
	"eval_f1": 0.914220821168919,
	"eval_loss": 0.4336497485637665,
	"eval_precision": 0.9142236947687447,
	"eval_recall": 0.9148816234498309,
	"eval_runtime": 31.4364,
	"eval_samples_per_second": 56.431,
	"eval_steps_per_second": 0.891,
	"step": 4937
	},
	{
	"epoch": 79.04,
	"learning_rate": 0.00020387096774193548,
	"loss": 0.13,
	"step": 4940
	},
	{
	"epoch": 79.2,
	"learning_rate": 0.00020225806451612904,
	"loss": 0.1212,
	"step": 4950
	},
	{
	"epoch": 79.36,
	"learning_rate": 0.0002006451612903226,
	"loss": 0.0928,
	"step": 4960
	},
	{
	"epoch": 79.52,
	"learning_rate": 0.00019903225806451613,
	"loss": 0.1227,
	"step": 4970
	},
	{
	"epoch": 79.68,
	"learning_rate": 0.00019741935483870969,
	"loss": 0.1283,
	"step": 4980
	},
	{
	"epoch": 79.84,
	"learning_rate": 0.00019580645161290322,
	"loss": 0.1174,
	"step": 4990
	},
	{
	"epoch": 80.0,
	"learning_rate": 0.00019419354838709678,
	"loss": 0.118,
	"step": 5000
	},
	{
	"epoch": 80.0,
	"step": 5000,
	"train_accuracy": 0.9766246788243405,
	"train_f1": 0.9765541131510495,
	"train_loss": 0.0666293278336525,
	"train_precision": 0.9766229850859756,
	"train_recall": 0.9766246788243405,
	"train_runtime": 259.1008,
	"train_samples_per_second": 61.586,
	"train_steps_per_second": 0.965
	},
	{
	"epoch": 80.0,
	"eval_accuracy": 0.9086809470124013,
	"eval_f1": 0.90750875812957,
	"eval_loss": 0.45560184121131897,
	"eval_precision": 0.9079785564126395,
	"eval_recall": 0.9086809470124013,
	"eval_runtime": 31.9115,
	"eval_samples_per_second": 55.591,
	"eval_steps_per_second": 0.877,
	"step": 5000
	},
	{
	"epoch": 80.16,
	"learning_rate": 0.0001925806451612903,
	"loss": 0.0913,
	"step": 5010
	},
	{
	"epoch": 80.32,
	"learning_rate": 0.0001909677419354839,
	"loss": 0.124,
	"step": 5020
	},
	{
	"epoch": 80.48,
	"learning_rate": 0.00018935483870967742,
	"loss": 0.1009,
	"step": 5030
	},
	{
	"epoch": 80.64,
	"learning_rate": 0.00018774193548387098,
	"loss": 0.1101,
	"step": 5040
	},
	{
	"epoch": 80.8,
	"learning_rate": 0.0001861290322580645,
	"loss": 0.1066,
	"step": 5050
	},
	{
	"epoch": 80.96,
	"learning_rate": 0.00018451612903225807,
	"loss": 0.1135,
	"step": 5060
	},
	{
	"epoch": 80.99,
	"step": 5062,
	"train_accuracy": 0.9778153788306072,
	"train_f1": 0.9777754434919425,
	"train_loss": 0.0617908276617527,
	"train_precision": 0.9778452684709104,
	"train_recall": 0.9778153788306072,
	"train_runtime": 256.2036,
	"train_samples_per_second": 62.282,
	"train_steps_per_second": 0.976
	},
	{
	"epoch": 80.99,
	"eval_accuracy": 0.9098083427282976,
	"eval_f1": 0.9089912962963755,
	"eval_loss": 0.4518835246562958,
	"eval_precision": 0.9089474065575852,
	"eval_recall": 0.9098083427282976,
	"eval_runtime": 30.3175,
	"eval_samples_per_second": 58.514,
	"eval_steps_per_second": 0.924,
	"step": 5062
	},
	{
	"epoch": 81.12,
	"learning_rate": 0.0001829032258064516,
	"loss": 0.1126,
	"step": 5070
	},
	{
	"epoch": 81.28,
	"learning_rate": 0.0001812903225806452,
	"loss": 0.1193,
	"step": 5080
	},
	{
	"epoch": 81.44,
	"learning_rate": 0.00017967741935483872,
	"loss": 0.1,
	"step": 5090
	},
	{
	"epoch": 81.6,
	"learning_rate": 0.00017806451612903228,
	"loss": 0.1133,
	"step": 5100
	},
	{
	"epoch": 81.76,
	"learning_rate": 0.0001764516129032258,
	"loss": 0.1108,
	"step": 5110
	},
	{
	"epoch": 81.92,
	"learning_rate": 0.00017483870967741936,
	"loss": 0.1047,
	"step": 5120
	},
	{
	"epoch": 82.0,
	"step": 5125,
	"train_accuracy": 0.9804474525286708,
	"train_f1": 0.9803932668866718,
	"train_loss": 0.05864088237285614,
	"train_precision": 0.9804524158920493,
	"train_recall": 0.9804474525286708,
	"train_runtime": 255.5222,
	"train_samples_per_second": 62.449,
	"train_steps_per_second": 0.978
	},
	{
	"epoch": 82.0,
	"eval_accuracy": 0.9086809470124013,
	"eval_f1": 0.9077573719855858,
	"eval_loss": 0.46281760931015015,
	"eval_precision": 0.9078136987288633,
	"eval_recall": 0.9086809470124013,
	"eval_runtime": 29.6004,
	"eval_samples_per_second": 59.932,
	"eval_steps_per_second": 0.946,
	"step": 5125
	},
	{
	"epoch": 82.08,
	"learning_rate": 0.0001732258064516129,
	"loss": 0.1049,
	"step": 5130
	},
	{
	"epoch": 82.24,
	"learning_rate": 0.00017161290322580645,
	"loss": 0.1198,
	"step": 5140
	},
	{
	"epoch": 82.4,
	"learning_rate": 0.00017,
	"loss": 0.1013,
	"step": 5150
	},
	{
	"epoch": 82.56,
	"learning_rate": 0.00016838709677419357,
	"loss": 0.1196,
	"step": 5160
	},
	{
	"epoch": 82.72,
	"learning_rate": 0.0001667741935483871,
	"loss": 0.1076,
	"step": 5170
	},
	{
	"epoch": 82.88,
	"learning_rate": 0.00016516129032258066,
	"loss": 0.0977,
	"step": 5180
	},
	{
	"epoch": 82.99,
	"step": 5187,
	"train_accuracy": 0.9785047314658144,
	"train_f1": 0.9784666340134569,
	"train_loss": 0.061825916171073914,
	"train_precision": 0.9784978840692157,
	"train_recall": 0.9785047314658144,
	"train_runtime": 254.0139,
	"train_samples_per_second": 62.819,
	"train_steps_per_second": 0.984
	},
	{
	"epoch": 82.99,
	"eval_accuracy": 0.9098083427282976,
	"eval_f1": 0.9089103848523707,
	"eval_loss": 0.4576462209224701,
	"eval_precision": 0.9088881743285697,
	"eval_recall": 0.9098083427282976,
	"eval_runtime": 29.6463,
	"eval_samples_per_second": 59.839,
	"eval_steps_per_second": 0.944,
	"step": 5187
	},
	{
	"epoch": 83.04,
	"learning_rate": 0.0001635483870967742,
	"loss": 0.0983,
	"step": 5190
	},
	{
	"epoch": 83.2,
	"learning_rate": 0.00016193548387096775,
	"loss": 0.1126,
	"step": 5200
	},
	{
	"epoch": 83.36,
	"learning_rate": 0.00016032258064516128,
	"loss": 0.1362,
	"step": 5210
	},
	{
	"epoch": 83.52,
	"learning_rate": 0.00015870967741935487,
	"loss": 0.1073,
	"step": 5220
	},
	{
	"epoch": 83.68,
	"learning_rate": 0.0001570967741935484,
	"loss": 0.111,
	"step": 5230
	},
	{
	"epoch": 83.84,
	"learning_rate": 0.00015548387096774195,
	"loss": 0.1125,
	"step": 5240
	},
	{
	"epoch": 84.0,
	"learning_rate": 0.00015387096774193549,
	"loss": 0.1149,
	"step": 5250
	},
	{
	"epoch": 84.0,
	"step": 5250,
	"train_accuracy": 0.980886131478348,
	"train_f1": 0.9808510090193131,
	"train_loss": 0.05500573664903641,
	"train_precision": 0.9808883134493344,
	"train_recall": 0.980886131478348,
	"train_runtime": 260.1325,
	"train_samples_per_second": 61.342,
	"train_steps_per_second": 0.961
	},
	{
	"epoch": 84.0,
	"eval_accuracy": 0.9120631341600902,
	"eval_f1": 0.911138462348306,
	"eval_loss": 0.4605374038219452,
	"eval_precision": 0.9110930924781012,
	"eval_recall": 0.9120631341600902,
	"eval_runtime": 29.9251,
	"eval_samples_per_second": 59.281,
	"eval_steps_per_second": 0.936,
	"step": 5250
	},
	{
	"epoch": 84.16,
	"learning_rate": 0.00015225806451612904,
	"loss": 0.0955,
	"step": 5260
	},
	{
	"epoch": 84.32,
	"learning_rate": 0.00015064516129032257,
	"loss": 0.1187,
	"step": 5270
	},
	{
	"epoch": 84.48,
	"learning_rate": 0.0001490322580645161,
	"loss": 0.1101,
	"step": 5280
	},
	{
	"epoch": 84.64,
	"learning_rate": 0.0001474193548387097,
	"loss": 0.106,
	"step": 5290
	},
	{
	"epoch": 84.8,
	"learning_rate": 0.00014580645161290322,
	"loss": 0.099,
	"step": 5300
	},
	{
	"epoch": 84.96,
	"learning_rate": 0.00014419354838709678,
	"loss": 0.1241,
	"step": 5310
	},
	{
	"epoch": 84.99,
	"step": 5312,
	"train_accuracy": 0.9786927367299618,
	"train_f1": 0.9786376256812076,
	"train_loss": 0.0632563978433609,
	"train_precision": 0.9786888233858622,
	"train_recall": 0.9786927367299618,
	"train_runtime": 253.1029,
	"train_samples_per_second": 63.046,
	"train_steps_per_second": 0.988
	},
	{
	"epoch": 84.99,
	"eval_accuracy": 0.9131905298759865,
	"eval_f1": 0.9126492909049198,
	"eval_loss": 0.4541684687137604,
	"eval_precision": 0.9125019654104216,
	"eval_recall": 0.9131905298759865,
	"eval_runtime": 36.7528,
	"eval_samples_per_second": 48.268,
	"eval_steps_per_second": 0.762,
	"step": 5312
	},
	{
	"epoch": 85.12,
	"learning_rate": 0.0001425806451612903,
	"loss": 0.1174,
	"step": 5320
	},
	{
	"epoch": 85.28,
	"learning_rate": 0.00014096774193548387,
	"loss": 0.1129,
	"step": 5330
	},
	{
	"epoch": 85.44,
	"learning_rate": 0.0001393548387096774,
	"loss": 0.0965,
	"step": 5340
	},
	{
	"epoch": 85.6,
	"learning_rate": 0.00013774193548387099,
	"loss": 0.0996,
	"step": 5350
	},
	{
	"epoch": 85.76,
	"learning_rate": 0.00013612903225806452,
	"loss": 0.1188,
	"step": 5360
	},
	{
	"epoch": 85.92,
	"learning_rate": 0.00013451612903225807,
	"loss": 0.1262,
	"step": 5370
	},
	{
	"epoch": 86.0,
	"step": 5375,
	"train_accuracy": 0.9786927367299618,
	"train_f1": 0.9786430332999637,
	"train_loss": 0.06230182945728302,
	"train_precision": 0.9787228334576183,
	"train_recall": 0.9786927367299618,
	"train_runtime": 254.0805,
	"train_samples_per_second": 62.803,
	"train_steps_per_second": 0.984
	},
	{
	"epoch": 86.0,
	"eval_accuracy": 0.9081172491544532,
	"eval_f1": 0.9073973897547527,
	"eval_loss": 0.45515382289886475,
	"eval_precision": 0.9074033025441,
	"eval_recall": 0.9081172491544532,
	"eval_runtime": 29.4676,
	"eval_samples_per_second": 60.202,
	"eval_steps_per_second": 0.95,
	"step": 5375
	},
	{
	"epoch": 86.08,
	"learning_rate": 0.0001329032258064516,
	"loss": 0.1058,
	"step": 5380
	},
	{
	"epoch": 86.24,
	"learning_rate": 0.00013129032258064516,
	"loss": 0.1131,
	"step": 5390
	},
	{
	"epoch": 86.4,
	"learning_rate": 0.0001296774193548387,
	"loss": 0.1009,
	"step": 5400
	},
	{
	"epoch": 86.56,
	"learning_rate": 0.00012806451612903225,
	"loss": 0.1047,
	"step": 5410
	},
	{
	"epoch": 86.72,
	"learning_rate": 0.0001264516129032258,
	"loss": 0.1055,
	"step": 5420
	},
	{
	"epoch": 86.88,
	"learning_rate": 0.00012483870967741934,
	"loss": 0.1114,
	"step": 5430
	},
	{
	"epoch": 86.99,
	"step": 5437,
	"train_accuracy": 0.9789434104154916,
	"train_f1": 0.9788727186488501,
	"train_loss": 0.05873732641339302,
	"train_precision": 0.9789898516890257,
	"train_recall": 0.9789434104154916,
	"train_runtime": 252.3787,
	"train_samples_per_second": 63.226,
	"train_steps_per_second": 0.991
	},
	{
	"epoch": 86.99,
	"eval_accuracy": 0.9081172491544532,
	"eval_f1": 0.907050844291005,
	"eval_loss": 0.46865400671958923,
	"eval_precision": 0.9071698989671065,
	"eval_recall": 0.9081172491544532,
	"eval_runtime": 29.1201,
	"eval_samples_per_second": 60.92,
	"eval_steps_per_second": 0.962,
	"step": 5437
	},
	{
	"epoch": 87.04,
	"learning_rate": 0.0001232258064516129,
	"loss": 0.0953,
	"step": 5440
	},
	{
	"epoch": 87.2,
	"learning_rate": 0.00012161290322580646,
	"loss": 0.0895,
	"step": 5450
	},
	{
	"epoch": 87.36,
	"learning_rate": 0.00012,
	"loss": 0.1122,
	"step": 5460
	},
	{
	"epoch": 87.52,
	"learning_rate": 0.00011838709677419356,
	"loss": 0.1169,
	"step": 5470
	},
	{
	"epoch": 87.68,
	"learning_rate": 0.0001167741935483871,
	"loss": 0.1031,
	"step": 5480
	},
	{
	"epoch": 87.84,
	"learning_rate": 0.00011516129032258065,
	"loss": 0.1052,
	"step": 5490
	},
	{
	"epoch": 88.0,
	"learning_rate": 0.00011354838709677421,
	"loss": 0.0835,
	"step": 5500
	},
	{
	"epoch": 88.0,
	"step": 5500,
	"train_accuracy": 0.9811994735852604,
	"train_f1": 0.9811537862655559,
	"train_loss": 0.05588332563638687,
	"train_precision": 0.9812213014473542,
	"train_recall": 0.9811994735852604,
	"train_runtime": 251.2614,
	"train_samples_per_second": 63.508,
	"train_steps_per_second": 0.995
	},
	{
	"epoch": 88.0,
	"eval_accuracy": 0.9098083427282976,
	"eval_f1": 0.908811337868185,
	"eval_loss": 0.4702069163322449,
	"eval_precision": 0.9089224577124531,
	"eval_recall": 0.9098083427282976,
	"eval_runtime": 29.3425,
	"eval_samples_per_second": 60.458,
	"eval_steps_per_second": 0.954,
	"step": 5500
	},
	{
	"epoch": 88.16,
	"learning_rate": 0.00011193548387096775,
	"loss": 0.1158,
	"step": 5510
	},
	{
	"epoch": 88.32,
	"learning_rate": 0.0001103225806451613,
	"loss": 0.1029,
	"step": 5520
	},
	{
	"epoch": 88.48,
	"learning_rate": 0.00010870967741935483,
	"loss": 0.0978,
	"step": 5530
	},
	{
	"epoch": 88.64,
	"learning_rate": 0.00010709677419354839,
	"loss": 0.1028,
	"step": 5540
	},
	{
	"epoch": 88.8,
	"learning_rate": 0.00010548387096774193,
	"loss": 0.1053,
	"step": 5550
	},
	{
	"epoch": 88.96,
	"learning_rate": 0.00010387096774193548,
	"loss": 0.1174,
	"step": 5560
	},
	{
	"epoch": 88.99,
	"step": 5562,
	"train_accuracy": 0.9806981262142007,
	"train_f1": 0.980651790063678,
	"train_loss": 0.05491610988974571,
	"train_precision": 0.9806996834447476,
	"train_recall": 0.9806981262142007,
	"train_runtime": 252.31,
	"train_samples_per_second": 63.244,
	"train_steps_per_second": 0.991
	},
	{
	"epoch": 88.99,
	"eval_accuracy": 0.9058624577226606,
	"eval_f1": 0.9047448567468519,
	"eval_loss": 0.4772195518016815,
	"eval_precision": 0.9049010825589036,
	"eval_recall": 0.9058624577226606,
	"eval_runtime": 29.443,
	"eval_samples_per_second": 60.252,
	"eval_steps_per_second": 0.951,
	"step": 5562
	},
	{
	"epoch": 89.12,
	"learning_rate": 0.00010225806451612903,
	"loss": 0.1106,
	"step": 5570
	},
	{
	"epoch": 89.28,
	"learning_rate": 0.00010064516129032258,
	"loss": 0.0965,
	"step": 5580
	},
	{
	"epoch": 89.44,
	"learning_rate": 9.903225806451612e-05,
	"loss": 0.1145,
	"step": 5590
	},
	{
	"epoch": 89.6,
	"learning_rate": 9.741935483870967e-05,
	"loss": 0.1069,
	"step": 5600
	},
	{
	"epoch": 89.76,
	"learning_rate": 9.580645161290323e-05,
	"loss": 0.1008,
	"step": 5610
	},
	{
	"epoch": 89.92,
	"learning_rate": 9.419354838709677e-05,
	"loss": 0.103,
	"step": 5620
	},
	{
	"epoch": 90.0,
	"step": 5625,
	"train_accuracy": 0.9815754841135552,
	"train_f1": 0.9815346716904167,
	"train_loss": 0.05348266288638115,
	"train_precision": 0.9815797384790222,
	"train_recall": 0.9815754841135552,
	"train_runtime": 252.062,
	"train_samples_per_second": 63.306,
	"train_steps_per_second": 0.992
	},
	{
	"epoch": 90.0,
	"eval_accuracy": 0.9075535512965051,
	"eval_f1": 0.9065308517183118,
	"eval_loss": 0.4701833724975586,
	"eval_precision": 0.9065469838144254,
	"eval_recall": 0.9075535512965051,
	"eval_runtime": 29.5689,
	"eval_samples_per_second": 59.995,
	"eval_steps_per_second": 0.947,
	"step": 5625
	},
	{
	"epoch": 90.08,
	"learning_rate": 9.258064516129032e-05,
	"loss": 0.0977,
	"step": 5630
	},
	{
	"epoch": 90.24,
	"learning_rate": 9.096774193548387e-05,
	"loss": 0.0948,
	"step": 5640
	},
	{
	"epoch": 90.4,
	"learning_rate": 8.935483870967742e-05,
	"loss": 0.0803,
	"step": 5650
	},
	{
	"epoch": 90.56,
	"learning_rate": 8.774193548387096e-05,
	"loss": 0.1025,
	"step": 5660
	},
	{
	"epoch": 90.72,
	"learning_rate": 8.612903225806452e-05,
	"loss": 0.1056,
	"step": 5670
	},
	{
	"epoch": 90.88,
	"learning_rate": 8.451612903225807e-05,
	"loss": 0.1086,
	"step": 5680
	},
	{
	"epoch": 90.99,
	"step": 5687,
	"train_accuracy": 0.9794447577865514,
	"train_f1": 0.9794042503142155,
	"train_loss": 0.05922425910830498,
	"train_precision": 0.979461044879249,
	"train_recall": 0.9794447577865514,
	"train_runtime": 253.2112,
	"train_samples_per_second": 63.019,
	"train_steps_per_second": 0.987
	},
	{
	"epoch": 90.99,
	"eval_accuracy": 0.9081172491544532,
	"eval_f1": 0.9074336656449804,
	"eval_loss": 0.4727869927883148,
	"eval_precision": 0.9075490421138191,
	"eval_recall": 0.9081172491544532,
	"eval_runtime": 29.3104,
	"eval_samples_per_second": 60.525,
	"eval_steps_per_second": 0.955,
	"step": 5687
	},
	{
	"epoch": 91.04,
	"learning_rate": 8.290322580645161e-05,
	"loss": 0.1074,
	"step": 5690
	},
	{
	"epoch": 91.2,
	"learning_rate": 8.129032258064515e-05,
	"loss": 0.1017,
	"step": 5700
	},
	{
	"epoch": 91.36,
	"learning_rate": 7.967741935483871e-05,
	"loss": 0.0971,
	"step": 5710
	},
	{
	"epoch": 91.52,
	"learning_rate": 7.806451612903226e-05,
	"loss": 0.1191,
	"step": 5720
	},
	{
	"epoch": 91.68,
	"learning_rate": 7.64516129032258e-05,
	"loss": 0.0995,
	"step": 5730
	},
	{
	"epoch": 91.84,
	"learning_rate": 7.483870967741936e-05,
	"loss": 0.1142,
	"step": 5740
	},
	{
	"epoch": 92.0,
	"learning_rate": 7.32258064516129e-05,
	"loss": 0.1087,
	"step": 5750
	},
	{
	"epoch": 92.0,
	"step": 5750,
	"train_accuracy": 0.9796954314720813,
	"train_f1": 0.9796272548376432,
	"train_loss": 0.05848938599228859,
	"train_precision": 0.9797640627474504,
	"train_recall": 0.9796954314720813,
	"train_runtime": 254.0646,
	"train_samples_per_second": 62.807,
	"train_steps_per_second": 0.984
	},
	{
	"epoch": 92.0,
	"eval_accuracy": 0.9075535512965051,
	"eval_f1": 0.9065640932569152,
	"eval_loss": 0.4691586196422577,
	"eval_precision": 0.9068629961295476,
	"eval_recall": 0.9075535512965051,
	"eval_runtime": 29.6211,
	"eval_samples_per_second": 59.89,
	"eval_steps_per_second": 0.945,
	"step": 5750
	},
	{
	"epoch": 92.16,
	"learning_rate": 7.161290322580645e-05,
	"loss": 0.1036,
	"step": 5760
	},
	{
	"epoch": 92.32,
	"learning_rate": 7.000000000000001e-05,
	"loss": 0.0991,
	"step": 5770
	},
	{
	"epoch": 92.48,
	"learning_rate": 6.838709677419355e-05,
	"loss": 0.1042,
	"step": 5780
	},
	{
	"epoch": 92.64,
	"learning_rate": 6.67741935483871e-05,
	"loss": 0.0997,
	"step": 5790
	},
	{
	"epoch": 92.8,
	"learning_rate": 6.516129032258064e-05,
	"loss": 0.0921,
	"step": 5800
	},
	{
	"epoch": 92.96,
	"learning_rate": 6.35483870967742e-05,
	"loss": 0.1041,
	"step": 5810
	},
	{
	"epoch": 92.99,
	"step": 5812,
	"train_accuracy": 0.979131415679639,
	"train_f1": 0.9790799084691278,
	"train_loss": 0.0558781623840332,
	"train_precision": 0.9791236279775183,
	"train_recall": 0.979131415679639,
	"train_runtime": 253.4519,
	"train_samples_per_second": 62.959,
	"train_steps_per_second": 0.986
	},
	{
	"epoch": 92.99,
	"eval_accuracy": 0.9086809470124013,
	"eval_f1": 0.9078901238987158,
	"eval_loss": 0.45839613676071167,
	"eval_precision": 0.9079266988153948,
	"eval_recall": 0.9086809470124013,
	"eval_runtime": 29.4342,
	"eval_samples_per_second": 60.27,
	"eval_steps_per_second": 0.951,
	"step": 5812
	},
	{
	"epoch": 93.12,
	"learning_rate": 6.193548387096774e-05,
	"loss": 0.116,
	"step": 5820
	},
	{
	"epoch": 93.28,
	"learning_rate": 6.0322580645161295e-05,
	"loss": 0.103,
	"step": 5830
	},
	{
	"epoch": 93.44,
	"learning_rate": 5.870967741935484e-05,
	"loss": 0.1129,
	"step": 5840
	},
	{
	"epoch": 93.6,
	"learning_rate": 5.709677419354839e-05,
	"loss": 0.1034,
	"step": 5850
	},
	{
	"epoch": 93.76,
	"learning_rate": 5.5483870967741936e-05,
	"loss": 0.1134,
	"step": 5860
	},
	{
	"epoch": 93.92,
	"learning_rate": 5.387096774193549e-05,
	"loss": 0.1109,
	"step": 5870
	},
	{
	"epoch": 94.0,
	"step": 5875,
	"train_accuracy": 0.9796327630506988,
	"train_f1": 0.9795750790681897,
	"train_loss": 0.05882110819220543,
	"train_precision": 0.9796458578935032,
	"train_recall": 0.9796327630506988,
	"train_runtime": 253.4567,
	"train_samples_per_second": 62.957,
	"train_steps_per_second": 0.986
	},
	{
	"epoch": 94.0,
	"eval_accuracy": 0.9092446448703495,
	"eval_f1": 0.9084684905580462,
	"eval_loss": 0.45630526542663574,
	"eval_precision": 0.9085750924367912,
	"eval_recall": 0.9092446448703495,
	"eval_runtime": 29.3382,
	"eval_samples_per_second": 60.467,
	"eval_steps_per_second": 0.954,
	"step": 5875
	},
	{
	"epoch": 94.08,
	"learning_rate": 5.225806451612904e-05,
	"loss": 0.0848,
	"step": 5880
	},
	{
	"epoch": 94.24,
	"learning_rate": 5.064516129032258e-05,
	"loss": 0.1063,
	"step": 5890
	},
	{
	"epoch": 94.4,
	"learning_rate": 4.9032258064516135e-05,
	"loss": 0.0929,
	"step": 5900
	},
	{
	"epoch": 94.56,
	"learning_rate": 4.741935483870968e-05,
	"loss": 0.1039,
	"step": 5910
	},
	{
	"epoch": 94.72,
	"learning_rate": 4.580645161290323e-05,
	"loss": 0.099,
	"step": 5920
	},
	{
	"epoch": 94.88,
	"learning_rate": 4.4193548387096775e-05,
	"loss": 0.1026,
	"step": 5930
	},
	{
	"epoch": 94.99,
	"step": 5937,
	"train_accuracy": 0.9824528420129097,
	"train_f1": 0.9824112060096897,
	"train_loss": 0.05392773821949959,
	"train_precision": 0.9824786275566851,
	"train_recall": 0.9824528420129097,
	"train_runtime": 252.5661,
	"train_samples_per_second": 63.179,
	"train_steps_per_second": 0.99
	},
	{
	"epoch": 94.99,
	"eval_accuracy": 0.9126268320180383,
	"eval_f1": 0.9117417948122799,
	"eval_loss": 0.4614848494529724,
	"eval_precision": 0.911808467672524,
	"eval_recall": 0.9126268320180383,
	"eval_runtime": 29.3223,
	"eval_samples_per_second": 60.5,
	"eval_steps_per_second": 0.955,
	"step": 5937
	},
	{
	"epoch": 95.04,
	"learning_rate": 4.258064516129032e-05,
	"loss": 0.1026,
	"step": 5940
	},
	{
	"epoch": 95.2,
	"learning_rate": 4.096774193548387e-05,
	"loss": 0.0942,
	"step": 5950
	},
	{
	"epoch": 95.36,
	"learning_rate": 3.9354838709677416e-05,
	"loss": 0.0936,
	"step": 5960
	},
	{
	"epoch": 95.52,
	"learning_rate": 3.774193548387097e-05,
	"loss": 0.0833,
	"step": 5970
	},
	{
	"epoch": 95.68,
	"learning_rate": 3.612903225806452e-05,
	"loss": 0.096,
	"step": 5980
	},
	{
	"epoch": 95.84,
	"learning_rate": 3.451612903225806e-05,
	"loss": 0.106,
	"step": 5990
	},
	{
	"epoch": 96.0,
	"learning_rate": 3.2903225806451614e-05,
	"loss": 0.0895,
	"step": 6000
	},
	{
	"epoch": 96.0,
	"step": 6000,
	"train_accuracy": 0.9817634893777025,
	"train_f1": 0.9817217910538368,
	"train_loss": 0.053316567093133926,
	"train_precision": 0.981748670799393,
	"train_recall": 0.9817634893777025,
	"train_runtime": 254.5693,
	"train_samples_per_second": 62.682,
	"train_steps_per_second": 0.982
	},
	{
	"epoch": 96.0,
	"eval_accuracy": 0.9092446448703495,
	"eval_f1": 0.908628347766777,
	"eval_loss": 0.4585205316543579,
	"eval_precision": 0.9086756206676724,
	"eval_recall": 0.9092446448703495,
	"eval_runtime": 29.7078,
	"eval_samples_per_second": 59.715,
	"eval_steps_per_second": 0.943,
	"step": 6000
	},
	{
	"epoch": 96.16,
	"learning_rate": 3.129032258064516e-05,
	"loss": 0.1019,
	"step": 6010
	},
	{
	"epoch": 96.32,
	"learning_rate": 2.967741935483871e-05,
	"loss": 0.1046,
	"step": 6020
	},
	{
	"epoch": 96.48,
	"learning_rate": 2.806451612903226e-05,
	"loss": 0.125,
	"step": 6030
	},
	{
	"epoch": 96.64,
	"learning_rate": 2.6451612903225806e-05,
	"loss": 0.0977,
	"step": 6040
	},
	{
	"epoch": 96.8,
	"learning_rate": 2.4838709677419354e-05,
	"loss": 0.104,
	"step": 6050
	},
	{
	"epoch": 96.96,
	"learning_rate": 2.3225806451612906e-05,
	"loss": 0.1045,
	"step": 6060
	},
	{
	"epoch": 96.99,
	"step": 6062,
	"train_accuracy": 0.9817008209563202,
	"train_f1": 0.9816508134314273,
	"train_loss": 0.05279777571558952,
	"train_precision": 0.9816910608821193,
	"train_recall": 0.9817008209563202,
	"train_runtime": 252.7534,
	"train_samples_per_second": 63.133,
	"train_steps_per_second": 0.989
	},
	{
	"epoch": 96.99,
	"eval_accuracy": 0.9098083427282976,
	"eval_f1": 0.909112926020381,
	"eval_loss": 0.45533671975135803,
	"eval_precision": 0.9090721377215957,
	"eval_recall": 0.9098083427282976,
	"eval_runtime": 33.0675,
	"eval_samples_per_second": 53.648,
	"eval_steps_per_second": 0.847,
	"step": 6062
	},
	{
	"epoch": 97.12,
	"learning_rate": 2.1612903225806454e-05,
	"loss": 0.0862,
	"step": 6070
	},
	{
	"epoch": 97.28,
	"learning_rate": 2e-05,
	"loss": 0.1078,
	"step": 6080
	},
	{
	"epoch": 97.44,
	"learning_rate": 1.838709677419355e-05,
	"loss": 0.1078,
	"step": 6090
	},
	{
	"epoch": 97.6,
	"learning_rate": 1.6774193548387098e-05,
	"loss": 0.107,
	"step": 6100
	},
	{
	"epoch": 97.76,
	"learning_rate": 1.5161290322580646e-05,
	"loss": 0.1139,
	"step": 6110
	},
	{
	"epoch": 97.92,
	"learning_rate": 1.3548387096774194e-05,
	"loss": 0.1081,
	"step": 6120
	},
	{
	"epoch": 98.0,
	"step": 6125,
	"train_accuracy": 0.9812621420066429,
	"train_f1": 0.9812114737389049,
	"train_loss": 0.054921120405197144,
	"train_precision": 0.9812508070970374,
	"train_recall": 0.9812621420066429,
	"train_runtime": 252.6106,
	"train_samples_per_second": 63.168,
	"train_steps_per_second": 0.99
	},
	{
	"epoch": 98.0,
	"eval_accuracy": 0.9103720405862458,
	"eval_f1": 0.9096321309054232,
	"eval_loss": 0.4532192647457123,
	"eval_precision": 0.9096536769299824,
	"eval_recall": 0.9103720405862458,
	"eval_runtime": 29.6384,
	"eval_samples_per_second": 59.855,
	"eval_steps_per_second": 0.945,
	"step": 6125
	},
	{
	"epoch": 98.08,
	"learning_rate": 1.1935483870967743e-05,
	"loss": 0.1011,
	"step": 6130
	},
	{
	"epoch": 98.24,
	"learning_rate": 1.0322580645161291e-05,
	"loss": 0.1031,
	"step": 6140
	},
	{
	"epoch": 98.4,
	"learning_rate": 8.709677419354838e-06,
	"loss": 0.0821,
	"step": 6150
	},
	{
	"epoch": 98.56,
	"learning_rate": 7.096774193548388e-06,
	"loss": 0.0901,
	"step": 6160
	},
	{
	"epoch": 98.72,
	"learning_rate": 5.483870967741935e-06,
	"loss": 0.0809,
	"step": 6170
	},
	{
	"epoch": 98.88,
	"learning_rate": 3.870967741935484e-06,
	"loss": 0.0932,
	"step": 6180
	},
	{
	"epoch": 98.99,
	"step": 6187,
	"train_accuracy": 0.9805101209500533,
	"train_f1": 0.9804742522228167,
	"train_loss": 0.055186156183481216,
	"train_precision": 0.980498073403408,
	"train_recall": 0.9805101209500533,
	"train_runtime": 254.3736,
	"train_samples_per_second": 62.731,
	"train_steps_per_second": 0.983
	},
	{
	"epoch": 98.99,
	"eval_accuracy": 0.9098083427282976,
	"eval_f1": 0.9090900239365977,
	"eval_loss": 0.4536750614643097,
	"eval_precision": 0.9091114953941556,
	"eval_recall": 0.9098083427282976,
	"eval_runtime": 29.5537,
	"eval_samples_per_second": 60.026,
	"eval_steps_per_second": 0.947,
	"step": 6187
	},
	{
	"epoch": 99.04,
	"learning_rate": 2.2580645161290324e-06,
	"loss": 0.1136,
	"step": 6190
	},
	{
	"epoch": 99.2,
	"learning_rate": 6.451612903225807e-07,
	"loss": 0.0934,
	"step": 6200
	},
	{
	"epoch": 99.2,
	"step": 6200,
	"train_accuracy": 0.9809487998997305,
	"train_f1": 0.9809066394306372,
	"train_loss": 0.05620851740241051,
	"train_precision": 0.9809434303564252,
	"train_recall": 0.9809487998997305,
	"train_runtime": 257.0414,
	"train_samples_per_second": 62.08,
	"train_steps_per_second": 0.973
	},
	{
	"epoch": 99.2,
	"eval_accuracy": 0.9098083427282976,
	"eval_f1": 0.9090900239365977,
	"eval_loss": 0.4539656639099121,
	"eval_precision": 0.9091114953941556,
	"eval_recall": 0.9098083427282976,
	"eval_runtime": 29.6217,
	"eval_samples_per_second": 59.889,
	"eval_steps_per_second": 0.945,
	"step": 6200
	},
	{
	"epoch": 99.2,
	"step": 6200,
	"total_flos": 9.4522774317222e+19,
	"train_loss": 0.2388173005080992,
	"train_runtime": 58791.9316,
	"train_samples_per_second": 27.141,
	"train_steps_per_second": 0.105
	}
	],
	"logging_steps": 10,
	"max_steps": 6200,
	"num_train_epochs": 100,
	"save_steps": 500,
	"total_flos": 9.4522774317222e+19,
	"trial_name": null,
	"trial_params": null
	}