checkpoint-26000 / trainer_state.json

Upload trainer_state.json with huggingface_hub

df9da1a verified 3 days ago

215 kB

	{
	"best_metric": 33.472796184515516,
	"best_model_checkpoint": "./whisper-distil-v3/checkpoint-26000",
	"epoch": 1.4247356019507917,
	"eval_steps": 1000,
	"global_step": 26000,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.0010959504630390707,
	"grad_norm": 5.807405471801758,
	"learning_rate": 3.6e-06,
	"loss": 8.6037,
	"step": 20
	},
	{
	"epoch": 0.0021919009260781414,
	"grad_norm": 5.726860523223877,
	"learning_rate": 7.6e-06,
	"loss": 8.4874,
	"step": 40
	},
	{
	"epoch": 0.003287851389117212,
	"grad_norm": 7.615314960479736,
	"learning_rate": 1.16e-05,
	"loss": 8.0934,
	"step": 60
	},
	{
	"epoch": 0.004383801852156283,
	"grad_norm": 7.089465618133545,
	"learning_rate": 1.56e-05,
	"loss": 7.4227,
	"step": 80
	},
	{
	"epoch": 0.005479752315195353,
	"grad_norm": 5.158086776733398,
	"learning_rate": 1.9600000000000002e-05,
	"loss": 6.3418,
	"step": 100
	},
	{
	"epoch": 0.006575702778234424,
	"grad_norm": 3.288583278656006,
	"learning_rate": 2.3400000000000003e-05,
	"loss": 5.2747,
	"step": 120
	},
	{
	"epoch": 0.007671653241273495,
	"grad_norm": 3.1715681552886963,
	"learning_rate": 2.7400000000000002e-05,
	"loss": 4.3075,
	"step": 140
	},
	{
	"epoch": 0.008767603704312565,
	"grad_norm": 3.033198833465576,
	"learning_rate": 3.1400000000000004e-05,
	"loss": 3.631,
	"step": 160
	},
	{
	"epoch": 0.009863554167351636,
	"grad_norm": 3.027251720428467,
	"learning_rate": 3.54e-05,
	"loss": 3.2186,
	"step": 180
	},
	{
	"epoch": 0.010959504630390707,
	"grad_norm": 2.9063901901245117,
	"learning_rate": 3.94e-05,
	"loss": 2.9226,
	"step": 200
	},
	{
	"epoch": 0.012055455093429777,
	"grad_norm": 3.1165690422058105,
	"learning_rate": 4.3400000000000005e-05,
	"loss": 2.8402,
	"step": 220
	},
	{
	"epoch": 0.013151405556468848,
	"grad_norm": 2.7977383136749268,
	"learning_rate": 4.74e-05,
	"loss": 2.613,
	"step": 240
	},
	{
	"epoch": 0.014247356019507919,
	"grad_norm": 3.7818286418914795,
	"learning_rate": 5.14e-05,
	"loss": 2.377,
	"step": 260
	},
	{
	"epoch": 0.01534330648254699,
	"grad_norm": 3.2088804244995117,
	"learning_rate": 5.5400000000000005e-05,
	"loss": 2.3204,
	"step": 280
	},
	{
	"epoch": 0.01643925694558606,
	"grad_norm": 3.2518157958984375,
	"learning_rate": 5.94e-05,
	"loss": 2.1812,
	"step": 300
	},
	{
	"epoch": 0.01753520740862513,
	"grad_norm": 3.725226640701294,
	"learning_rate": 6.340000000000001e-05,
	"loss": 2.158,
	"step": 320
	},
	{
	"epoch": 0.0186311578716642,
	"grad_norm": 3.5929486751556396,
	"learning_rate": 6.740000000000001e-05,
	"loss": 2.1241,
	"step": 340
	},
	{
	"epoch": 0.019727108334703272,
	"grad_norm": 4.1317572593688965,
	"learning_rate": 7.14e-05,
	"loss": 2.2284,
	"step": 360
	},
	{
	"epoch": 0.020823058797742343,
	"grad_norm": 3.4276161193847656,
	"learning_rate": 7.54e-05,
	"loss": 1.9655,
	"step": 380
	},
	{
	"epoch": 0.021919009260781414,
	"grad_norm": 3.9775540828704834,
	"learning_rate": 7.94e-05,
	"loss": 1.9407,
	"step": 400
	},
	{
	"epoch": 0.023014959723820484,
	"grad_norm": 3.67511248588562,
	"learning_rate": 8.34e-05,
	"loss": 1.9312,
	"step": 420
	},
	{
	"epoch": 0.024110910186859555,
	"grad_norm": 4.781565189361572,
	"learning_rate": 8.740000000000001e-05,
	"loss": 1.9218,
	"step": 440
	},
	{
	"epoch": 0.025206860649898626,
	"grad_norm": 5.2797698974609375,
	"learning_rate": 9.140000000000001e-05,
	"loss": 1.8729,
	"step": 460
	},
	{
	"epoch": 0.026302811112937696,
	"grad_norm": 6.1737284660339355,
	"learning_rate": 9.54e-05,
	"loss": 1.6848,
	"step": 480
	},
	{
	"epoch": 0.027398761575976767,
	"grad_norm": 4.926702976226807,
	"learning_rate": 9.94e-05,
	"loss": 1.8866,
	"step": 500
	},
	{
	"epoch": 0.028494712039015838,
	"grad_norm": 4.043098449707031,
	"learning_rate": 0.0001,
	"loss": 1.749,
	"step": 520
	},
	{
	"epoch": 0.02959066250205491,
	"grad_norm": 4.022521495819092,
	"learning_rate": 0.0001,
	"loss": 1.7654,
	"step": 540
	},
	{
	"epoch": 0.03068661296509398,
	"grad_norm": 3.1964547634124756,
	"learning_rate": 0.0001,
	"loss": 1.7496,
	"step": 560
	},
	{
	"epoch": 0.03178256342813305,
	"grad_norm": 3.5182583332061768,
	"learning_rate": 0.0001,
	"loss": 1.7312,
	"step": 580
	},
	{
	"epoch": 0.03287851389117212,
	"grad_norm": 3.529665231704712,
	"learning_rate": 0.0001,
	"loss": 1.6307,
	"step": 600
	},
	{
	"epoch": 0.03397446435421119,
	"grad_norm": 3.329401969909668,
	"learning_rate": 0.0001,
	"loss": 1.7613,
	"step": 620
	},
	{
	"epoch": 0.03507041481725026,
	"grad_norm": 3.4481399059295654,
	"learning_rate": 0.0001,
	"loss": 1.6204,
	"step": 640
	},
	{
	"epoch": 0.03616636528028933,
	"grad_norm": 3.3551902770996094,
	"learning_rate": 0.0001,
	"loss": 1.5846,
	"step": 660
	},
	{
	"epoch": 0.0372623157433284,
	"grad_norm": 3.591031074523926,
	"learning_rate": 0.0001,
	"loss": 1.6077,
	"step": 680
	},
	{
	"epoch": 0.038358266206367474,
	"grad_norm": 3.8630764484405518,
	"learning_rate": 0.0001,
	"loss": 1.5275,
	"step": 700
	},
	{
	"epoch": 0.039454216669406544,
	"grad_norm": 3.77461838722229,
	"learning_rate": 0.0001,
	"loss": 1.5386,
	"step": 720
	},
	{
	"epoch": 0.040550167132445615,
	"grad_norm": 2.9158153533935547,
	"learning_rate": 0.0001,
	"loss": 1.5536,
	"step": 740
	},
	{
	"epoch": 0.041646117595484686,
	"grad_norm": 3.761077642440796,
	"learning_rate": 0.0001,
	"loss": 1.5607,
	"step": 760
	},
	{
	"epoch": 0.042742068058523756,
	"grad_norm": 3.5758230686187744,
	"learning_rate": 0.0001,
	"loss": 1.5145,
	"step": 780
	},
	{
	"epoch": 0.04383801852156283,
	"grad_norm": 3.01175856590271,
	"learning_rate": 0.0001,
	"loss": 1.5639,
	"step": 800
	},
	{
	"epoch": 0.0449339689846019,
	"grad_norm": 3.8395230770111084,
	"learning_rate": 0.0001,
	"loss": 1.6478,
	"step": 820
	},
	{
	"epoch": 0.04602991944764097,
	"grad_norm": 2.9240541458129883,
	"learning_rate": 0.0001,
	"loss": 1.5303,
	"step": 840
	},
	{
	"epoch": 0.04712586991068004,
	"grad_norm": 3.603835344314575,
	"learning_rate": 0.0001,
	"loss": 1.4436,
	"step": 860
	},
	{
	"epoch": 0.04822182037371911,
	"grad_norm": 3.1701183319091797,
	"learning_rate": 0.0001,
	"loss": 1.5622,
	"step": 880
	},
	{
	"epoch": 0.04931777083675818,
	"grad_norm": 4.054835796356201,
	"learning_rate": 0.0001,
	"loss": 1.4354,
	"step": 900
	},
	{
	"epoch": 0.05041372129979725,
	"grad_norm": 2.9651615619659424,
	"learning_rate": 0.0001,
	"loss": 1.4676,
	"step": 920
	},
	{
	"epoch": 0.05150967176283632,
	"grad_norm": 3.2480218410491943,
	"learning_rate": 0.0001,
	"loss": 1.3769,
	"step": 940
	},
	{
	"epoch": 0.05260562222587539,
	"grad_norm": 3.494356155395508,
	"learning_rate": 0.0001,
	"loss": 1.4928,
	"step": 960
	},
	{
	"epoch": 0.05370157268891446,
	"grad_norm": 3.394205331802368,
	"learning_rate": 0.0001,
	"loss": 1.4045,
	"step": 980
	},
	{
	"epoch": 0.054797523151953534,
	"grad_norm": 3.333587646484375,
	"learning_rate": 0.0001,
	"loss": 1.4953,
	"step": 1000
	},
	{
	"epoch": 0.054797523151953534,
	"eval_loss": 1.4313914775848389,
	"eval_runtime": 30911.9498,
	"eval_samples_per_second": 2.099,
	"eval_steps_per_second": 0.066,
	"eval_wer": 70.88587442180551,
	"step": 1000
	},
	{
	"epoch": 0.055893473614992605,
	"grad_norm": 3.2317609786987305,
	"learning_rate": 0.0001,
	"loss": 1.4376,
	"step": 1020
	},
	{
	"epoch": 0.056989424078031675,
	"grad_norm": 2.9077706336975098,
	"learning_rate": 0.0001,
	"loss": 1.4398,
	"step": 1040
	},
	{
	"epoch": 0.058085374541070746,
	"grad_norm": 3.0054707527160645,
	"learning_rate": 0.0001,
	"loss": 1.4326,
	"step": 1060
	},
	{
	"epoch": 0.05918132500410982,
	"grad_norm": 3.7243480682373047,
	"learning_rate": 0.0001,
	"loss": 1.4915,
	"step": 1080
	},
	{
	"epoch": 0.06027727546714889,
	"grad_norm": 2.9608402252197266,
	"learning_rate": 0.0001,
	"loss": 1.4595,
	"step": 1100
	},
	{
	"epoch": 0.06137322593018796,
	"grad_norm": 2.652829885482788,
	"learning_rate": 0.0001,
	"loss": 1.4378,
	"step": 1120
	},
	{
	"epoch": 0.06246917639322703,
	"grad_norm": 2.9017295837402344,
	"learning_rate": 0.0001,
	"loss": 1.4257,
	"step": 1140
	},
	{
	"epoch": 0.0635651268562661,
	"grad_norm": 3.0610859394073486,
	"learning_rate": 0.0001,
	"loss": 1.348,
	"step": 1160
	},
	{
	"epoch": 0.06466107731930516,
	"grad_norm": 2.701765775680542,
	"learning_rate": 0.0001,
	"loss": 1.3853,
	"step": 1180
	},
	{
	"epoch": 0.06575702778234424,
	"grad_norm": 3.83376145362854,
	"learning_rate": 0.0001,
	"loss": 1.4708,
	"step": 1200
	},
	{
	"epoch": 0.0668529782453833,
	"grad_norm": 3.178449869155884,
	"learning_rate": 0.0001,
	"loss": 1.362,
	"step": 1220
	},
	{
	"epoch": 0.06794892870842238,
	"grad_norm": 3.796205997467041,
	"learning_rate": 0.0001,
	"loss": 1.4331,
	"step": 1240
	},
	{
	"epoch": 0.06904487917146145,
	"grad_norm": 2.8163928985595703,
	"learning_rate": 0.0001,
	"loss": 1.2835,
	"step": 1260
	},
	{
	"epoch": 0.07014082963450052,
	"grad_norm": 2.698793888092041,
	"learning_rate": 0.0001,
	"loss": 1.3444,
	"step": 1280
	},
	{
	"epoch": 0.07123678009753959,
	"grad_norm": 2.584484815597534,
	"learning_rate": 0.0001,
	"loss": 1.2145,
	"step": 1300
	},
	{
	"epoch": 0.07233273056057866,
	"grad_norm": 2.696967363357544,
	"learning_rate": 0.0001,
	"loss": 1.2855,
	"step": 1320
	},
	{
	"epoch": 0.07342868102361773,
	"grad_norm": 3.382924795150757,
	"learning_rate": 0.0001,
	"loss": 1.2164,
	"step": 1340
	},
	{
	"epoch": 0.0745246314866568,
	"grad_norm": 2.8127260208129883,
	"learning_rate": 0.0001,
	"loss": 1.2873,
	"step": 1360
	},
	{
	"epoch": 0.07562058194969587,
	"grad_norm": 2.631011724472046,
	"learning_rate": 0.0001,
	"loss": 1.3759,
	"step": 1380
	},
	{
	"epoch": 0.07671653241273495,
	"grad_norm": 2.913276433944702,
	"learning_rate": 0.0001,
	"loss": 1.2688,
	"step": 1400
	},
	{
	"epoch": 0.07781248287577401,
	"grad_norm": 2.811455488204956,
	"learning_rate": 0.0001,
	"loss": 1.2179,
	"step": 1420
	},
	{
	"epoch": 0.07890843333881309,
	"grad_norm": 2.8242247104644775,
	"learning_rate": 0.0001,
	"loss": 1.142,
	"step": 1440
	},
	{
	"epoch": 0.08000438380185215,
	"grad_norm": 3.1733341217041016,
	"learning_rate": 0.0001,
	"loss": 1.2934,
	"step": 1460
	},
	{
	"epoch": 0.08110033426489123,
	"grad_norm": 2.491945743560791,
	"learning_rate": 0.0001,
	"loss": 1.3274,
	"step": 1480
	},
	{
	"epoch": 0.0821962847279303,
	"grad_norm": 2.717165470123291,
	"learning_rate": 0.0001,
	"loss": 1.2484,
	"step": 1500
	},
	{
	"epoch": 0.08329223519096937,
	"grad_norm": 2.3187918663024902,
	"learning_rate": 0.0001,
	"loss": 1.2038,
	"step": 1520
	},
	{
	"epoch": 0.08438818565400844,
	"grad_norm": 2.9296529293060303,
	"learning_rate": 0.0001,
	"loss": 1.1962,
	"step": 1540
	},
	{
	"epoch": 0.08548413611704751,
	"grad_norm": 2.5763330459594727,
	"learning_rate": 0.0001,
	"loss": 1.2122,
	"step": 1560
	},
	{
	"epoch": 0.08658008658008658,
	"grad_norm": 3.4159390926361084,
	"learning_rate": 0.0001,
	"loss": 1.2302,
	"step": 1580
	},
	{
	"epoch": 0.08767603704312565,
	"grad_norm": 2.893261432647705,
	"learning_rate": 0.0001,
	"loss": 1.2106,
	"step": 1600
	},
	{
	"epoch": 0.08877198750616472,
	"grad_norm": 2.1891727447509766,
	"learning_rate": 0.0001,
	"loss": 1.2282,
	"step": 1620
	},
	{
	"epoch": 0.0898679379692038,
	"grad_norm": 2.4100029468536377,
	"learning_rate": 0.0001,
	"loss": 1.2039,
	"step": 1640
	},
	{
	"epoch": 0.09096388843224286,
	"grad_norm": 2.5420494079589844,
	"learning_rate": 0.0001,
	"loss": 1.2201,
	"step": 1660
	},
	{
	"epoch": 0.09205983889528194,
	"grad_norm": 3.1885313987731934,
	"learning_rate": 0.0001,
	"loss": 1.2446,
	"step": 1680
	},
	{
	"epoch": 0.093155789358321,
	"grad_norm": 3.120586633682251,
	"learning_rate": 0.0001,
	"loss": 1.2308,
	"step": 1700
	},
	{
	"epoch": 0.09425173982136008,
	"grad_norm": 2.4548628330230713,
	"learning_rate": 0.0001,
	"loss": 1.1777,
	"step": 1720
	},
	{
	"epoch": 0.09534769028439914,
	"grad_norm": 3.101803779602051,
	"learning_rate": 0.0001,
	"loss": 1.2123,
	"step": 1740
	},
	{
	"epoch": 0.09644364074743822,
	"grad_norm": 2.536121368408203,
	"learning_rate": 0.0001,
	"loss": 1.1914,
	"step": 1760
	},
	{
	"epoch": 0.09753959121047728,
	"grad_norm": 2.3796801567077637,
	"learning_rate": 0.0001,
	"loss": 1.1848,
	"step": 1780
	},
	{
	"epoch": 0.09863554167351636,
	"grad_norm": 2.67964243888855,
	"learning_rate": 0.0001,
	"loss": 1.1973,
	"step": 1800
	},
	{
	"epoch": 0.09973149213655542,
	"grad_norm": 3.160212755203247,
	"learning_rate": 0.0001,
	"loss": 1.2472,
	"step": 1820
	},
	{
	"epoch": 0.1008274425995945,
	"grad_norm": 2.7035927772521973,
	"learning_rate": 0.0001,
	"loss": 1.1844,
	"step": 1840
	},
	{
	"epoch": 0.10192339306263357,
	"grad_norm": 2.7725090980529785,
	"learning_rate": 0.0001,
	"loss": 1.1262,
	"step": 1860
	},
	{
	"epoch": 0.10301934352567264,
	"grad_norm": 2.2705016136169434,
	"learning_rate": 0.0001,
	"loss": 1.182,
	"step": 1880
	},
	{
	"epoch": 0.10411529398871171,
	"grad_norm": 3.0717403888702393,
	"learning_rate": 0.0001,
	"loss": 1.137,
	"step": 1900
	},
	{
	"epoch": 0.10521124445175078,
	"grad_norm": 2.9270904064178467,
	"learning_rate": 0.0001,
	"loss": 1.2556,
	"step": 1920
	},
	{
	"epoch": 0.10630719491478985,
	"grad_norm": 2.4564895629882812,
	"learning_rate": 0.0001,
	"loss": 1.1812,
	"step": 1940
	},
	{
	"epoch": 0.10740314537782893,
	"grad_norm": 2.983851909637451,
	"learning_rate": 0.0001,
	"loss": 1.1445,
	"step": 1960
	},
	{
	"epoch": 0.10849909584086799,
	"grad_norm": 2.772733688354492,
	"learning_rate": 0.0001,
	"loss": 1.1968,
	"step": 1980
	},
	{
	"epoch": 0.10959504630390707,
	"grad_norm": 2.9768126010894775,
	"learning_rate": 0.0001,
	"loss": 1.0942,
	"step": 2000
	},
	{
	"epoch": 0.10959504630390707,
	"eval_loss": 1.1446514129638672,
	"eval_runtime": 30634.8587,
	"eval_samples_per_second": 2.118,
	"eval_steps_per_second": 0.066,
	"eval_wer": 61.28519240053001,
	"step": 2000
	},
	{
	"epoch": 0.11069099676694613,
	"grad_norm": 2.806312322616577,
	"learning_rate": 0.0001,
	"loss": 1.1924,
	"step": 2020
	},
	{
	"epoch": 0.11178694722998521,
	"grad_norm": 2.639443874359131,
	"learning_rate": 0.0001,
	"loss": 1.0572,
	"step": 2040
	},
	{
	"epoch": 0.11288289769302427,
	"grad_norm": 2.2005367279052734,
	"learning_rate": 0.0001,
	"loss": 1.1337,
	"step": 2060
	},
	{
	"epoch": 0.11397884815606335,
	"grad_norm": 2.4102020263671875,
	"learning_rate": 0.0001,
	"loss": 1.1297,
	"step": 2080
	},
	{
	"epoch": 0.11507479861910241,
	"grad_norm": 3.410691976547241,
	"learning_rate": 0.0001,
	"loss": 1.1354,
	"step": 2100
	},
	{
	"epoch": 0.11617074908214149,
	"grad_norm": 2.1337172985076904,
	"learning_rate": 0.0001,
	"loss": 1.1725,
	"step": 2120
	},
	{
	"epoch": 0.11726669954518056,
	"grad_norm": 2.627319097518921,
	"learning_rate": 0.0001,
	"loss": 1.1006,
	"step": 2140
	},
	{
	"epoch": 0.11836265000821963,
	"grad_norm": 2.6450726985931396,
	"learning_rate": 0.0001,
	"loss": 1.0985,
	"step": 2160
	},
	{
	"epoch": 0.1194586004712587,
	"grad_norm": 2.3205084800720215,
	"learning_rate": 0.0001,
	"loss": 1.1634,
	"step": 2180
	},
	{
	"epoch": 0.12055455093429777,
	"grad_norm": 2.51177978515625,
	"learning_rate": 0.0001,
	"loss": 1.1697,
	"step": 2200
	},
	{
	"epoch": 0.12165050139733684,
	"grad_norm": 2.6632323265075684,
	"learning_rate": 0.0001,
	"loss": 1.071,
	"step": 2220
	},
	{
	"epoch": 0.12274645186037592,
	"grad_norm": 2.8322274684906006,
	"learning_rate": 0.0001,
	"loss": 1.0983,
	"step": 2240
	},
	{
	"epoch": 0.12384240232341498,
	"grad_norm": 2.547708749771118,
	"learning_rate": 0.0001,
	"loss": 1.0629,
	"step": 2260
	},
	{
	"epoch": 0.12493835278645406,
	"grad_norm": 2.6638150215148926,
	"learning_rate": 0.0001,
	"loss": 1.1985,
	"step": 2280
	},
	{
	"epoch": 0.12603430324949313,
	"grad_norm": 2.980463743209839,
	"learning_rate": 0.0001,
	"loss": 1.1885,
	"step": 2300
	},
	{
	"epoch": 0.1271302537125322,
	"grad_norm": 1.9924368858337402,
	"learning_rate": 0.0001,
	"loss": 1.0971,
	"step": 2320
	},
	{
	"epoch": 0.12822620417557126,
	"grad_norm": 2.2847180366516113,
	"learning_rate": 0.0001,
	"loss": 1.1149,
	"step": 2340
	},
	{
	"epoch": 0.12932215463861033,
	"grad_norm": 2.4860479831695557,
	"learning_rate": 0.0001,
	"loss": 1.0927,
	"step": 2360
	},
	{
	"epoch": 0.13041810510164942,
	"grad_norm": 2.3988494873046875,
	"learning_rate": 0.0001,
	"loss": 1.1918,
	"step": 2380
	},
	{
	"epoch": 0.13151405556468848,
	"grad_norm": 2.5361902713775635,
	"learning_rate": 0.0001,
	"loss": 1.0603,
	"step": 2400
	},
	{
	"epoch": 0.13261000602772754,
	"grad_norm": 2.4060215950012207,
	"learning_rate": 0.0001,
	"loss": 1.056,
	"step": 2420
	},
	{
	"epoch": 0.1337059564907666,
	"grad_norm": 2.4094231128692627,
	"learning_rate": 0.0001,
	"loss": 1.0787,
	"step": 2440
	},
	{
	"epoch": 0.1348019069538057,
	"grad_norm": 2.5207912921905518,
	"learning_rate": 0.0001,
	"loss": 1.0901,
	"step": 2460
	},
	{
	"epoch": 0.13589785741684476,
	"grad_norm": 2.1340293884277344,
	"learning_rate": 0.0001,
	"loss": 1.1691,
	"step": 2480
	},
	{
	"epoch": 0.13699380787988383,
	"grad_norm": 2.312554359436035,
	"learning_rate": 0.0001,
	"loss": 0.9791,
	"step": 2500
	},
	{
	"epoch": 0.1380897583429229,
	"grad_norm": 2.2881298065185547,
	"learning_rate": 0.0001,
	"loss": 0.9998,
	"step": 2520
	},
	{
	"epoch": 0.13918570880596198,
	"grad_norm": 2.2146573066711426,
	"learning_rate": 0.0001,
	"loss": 1.094,
	"step": 2540
	},
	{
	"epoch": 0.14028165926900105,
	"grad_norm": 2.3992650508880615,
	"learning_rate": 0.0001,
	"loss": 1.0667,
	"step": 2560
	},
	{
	"epoch": 0.1413776097320401,
	"grad_norm": 2.7630209922790527,
	"learning_rate": 0.0001,
	"loss": 1.1541,
	"step": 2580
	},
	{
	"epoch": 0.14247356019507917,
	"grad_norm": 2.9216675758361816,
	"learning_rate": 0.0001,
	"loss": 1.0463,
	"step": 2600
	},
	{
	"epoch": 0.14356951065811827,
	"grad_norm": 2.366373062133789,
	"learning_rate": 0.0001,
	"loss": 1.0557,
	"step": 2620
	},
	{
	"epoch": 0.14466546112115733,
	"grad_norm": 2.7161865234375,
	"learning_rate": 0.0001,
	"loss": 1.1066,
	"step": 2640
	},
	{
	"epoch": 0.1457614115841964,
	"grad_norm": 2.046992778778076,
	"learning_rate": 0.0001,
	"loss": 0.9786,
	"step": 2660
	},
	{
	"epoch": 0.14685736204723546,
	"grad_norm": 2.6320793628692627,
	"learning_rate": 0.0001,
	"loss": 0.9564,
	"step": 2680
	},
	{
	"epoch": 0.14795331251027455,
	"grad_norm": 2.485445737838745,
	"learning_rate": 0.0001,
	"loss": 1.0283,
	"step": 2700
	},
	{
	"epoch": 0.1490492629733136,
	"grad_norm": 2.267420768737793,
	"learning_rate": 0.0001,
	"loss": 1.0092,
	"step": 2720
	},
	{
	"epoch": 0.15014521343635268,
	"grad_norm": 2.618067502975464,
	"learning_rate": 0.0001,
	"loss": 1.0369,
	"step": 2740
	},
	{
	"epoch": 0.15124116389939174,
	"grad_norm": 2.502471685409546,
	"learning_rate": 0.0001,
	"loss": 0.9982,
	"step": 2760
	},
	{
	"epoch": 0.15233711436243083,
	"grad_norm": 2.936964273452759,
	"learning_rate": 0.0001,
	"loss": 1.1122,
	"step": 2780
	},
	{
	"epoch": 0.1534330648254699,
	"grad_norm": 2.5342159271240234,
	"learning_rate": 0.0001,
	"loss": 1.0409,
	"step": 2800
	},
	{
	"epoch": 0.15452901528850896,
	"grad_norm": 2.88598895072937,
	"learning_rate": 0.0001,
	"loss": 1.0259,
	"step": 2820
	},
	{
	"epoch": 0.15562496575154802,
	"grad_norm": 2.6327946186065674,
	"learning_rate": 0.0001,
	"loss": 0.9829,
	"step": 2840
	},
	{
	"epoch": 0.1567209162145871,
	"grad_norm": 2.4873671531677246,
	"learning_rate": 0.0001,
	"loss": 1.0472,
	"step": 2860
	},
	{
	"epoch": 0.15781686667762618,
	"grad_norm": 2.1543166637420654,
	"learning_rate": 0.0001,
	"loss": 1.0157,
	"step": 2880
	},
	{
	"epoch": 0.15891281714066524,
	"grad_norm": 1.9687381982803345,
	"learning_rate": 0.0001,
	"loss": 1.0465,
	"step": 2900
	},
	{
	"epoch": 0.1600087676037043,
	"grad_norm": 2.868544816970825,
	"learning_rate": 0.0001,
	"loss": 0.9835,
	"step": 2920
	},
	{
	"epoch": 0.1611047180667434,
	"grad_norm": 2.3211984634399414,
	"learning_rate": 0.0001,
	"loss": 1.1204,
	"step": 2940
	},
	{
	"epoch": 0.16220066852978246,
	"grad_norm": 2.631458282470703,
	"learning_rate": 0.0001,
	"loss": 1.0175,
	"step": 2960
	},
	{
	"epoch": 0.16329661899282152,
	"grad_norm": 2.7994022369384766,
	"learning_rate": 0.0001,
	"loss": 1.0828,
	"step": 2980
	},
	{
	"epoch": 0.1643925694558606,
	"grad_norm": 2.051626443862915,
	"learning_rate": 0.0001,
	"loss": 0.97,
	"step": 3000
	},
	{
	"epoch": 0.1643925694558606,
	"eval_loss": 1.0072325468063354,
	"eval_runtime": 30710.9249,
	"eval_samples_per_second": 2.113,
	"eval_steps_per_second": 0.066,
	"eval_wer": 55.08434535201816,
	"step": 3000
	},
	{
	"epoch": 0.16548851991889968,
	"grad_norm": 2.6088364124298096,
	"learning_rate": 0.0001,
	"loss": 0.9803,
	"step": 3020
	},
	{
	"epoch": 0.16658447038193874,
	"grad_norm": 2.234034299850464,
	"learning_rate": 0.0001,
	"loss": 1.0757,
	"step": 3040
	},
	{
	"epoch": 0.1676804208449778,
	"grad_norm": 2.3472328186035156,
	"learning_rate": 0.0001,
	"loss": 0.9408,
	"step": 3060
	},
	{
	"epoch": 0.16877637130801687,
	"grad_norm": 2.5871200561523438,
	"learning_rate": 0.0001,
	"loss": 0.9269,
	"step": 3080
	},
	{
	"epoch": 0.16987232177105596,
	"grad_norm": 2.0150465965270996,
	"learning_rate": 0.0001,
	"loss": 1.0547,
	"step": 3100
	},
	{
	"epoch": 0.17096827223409503,
	"grad_norm": 2.5823395252227783,
	"learning_rate": 0.0001,
	"loss": 1.0559,
	"step": 3120
	},
	{
	"epoch": 0.1720642226971341,
	"grad_norm": 2.8252885341644287,
	"learning_rate": 0.0001,
	"loss": 1.1219,
	"step": 3140
	},
	{
	"epoch": 0.17316017316017315,
	"grad_norm": 2.1086535453796387,
	"learning_rate": 0.0001,
	"loss": 1.0089,
	"step": 3160
	},
	{
	"epoch": 0.17425612362321224,
	"grad_norm": 2.2288014888763428,
	"learning_rate": 0.0001,
	"loss": 1.136,
	"step": 3180
	},
	{
	"epoch": 0.1753520740862513,
	"grad_norm": 2.6622703075408936,
	"learning_rate": 0.0001,
	"loss": 1.0395,
	"step": 3200
	},
	{
	"epoch": 0.17644802454929037,
	"grad_norm": 1.9478541612625122,
	"learning_rate": 0.0001,
	"loss": 1.0658,
	"step": 3220
	},
	{
	"epoch": 0.17754397501232944,
	"grad_norm": 2.55828857421875,
	"learning_rate": 0.0001,
	"loss": 0.9904,
	"step": 3240
	},
	{
	"epoch": 0.1786399254753685,
	"grad_norm": 2.533651828765869,
	"learning_rate": 0.0001,
	"loss": 0.9733,
	"step": 3260
	},
	{
	"epoch": 0.1797358759384076,
	"grad_norm": 1.8745101690292358,
	"learning_rate": 0.0001,
	"loss": 0.9903,
	"step": 3280
	},
	{
	"epoch": 0.18083182640144665,
	"grad_norm": 1.8459206819534302,
	"learning_rate": 0.0001,
	"loss": 0.9095,
	"step": 3300
	},
	{
	"epoch": 0.18192777686448572,
	"grad_norm": 2.6654012203216553,
	"learning_rate": 0.0001,
	"loss": 0.9854,
	"step": 3320
	},
	{
	"epoch": 0.18302372732752478,
	"grad_norm": 2.6444480419158936,
	"learning_rate": 0.0001,
	"loss": 0.8857,
	"step": 3340
	},
	{
	"epoch": 0.18411967779056387,
	"grad_norm": 2.190462827682495,
	"learning_rate": 0.0001,
	"loss": 0.9375,
	"step": 3360
	},
	{
	"epoch": 0.18521562825360294,
	"grad_norm": 2.8208882808685303,
	"learning_rate": 0.0001,
	"loss": 0.9646,
	"step": 3380
	},
	{
	"epoch": 0.186311578716642,
	"grad_norm": 2.4978795051574707,
	"learning_rate": 0.0001,
	"loss": 0.9724,
	"step": 3400
	},
	{
	"epoch": 0.18740752917968106,
	"grad_norm": 2.4202938079833984,
	"learning_rate": 0.0001,
	"loss": 0.9659,
	"step": 3420
	},
	{
	"epoch": 0.18850347964272016,
	"grad_norm": 1.9026118516921997,
	"learning_rate": 0.0001,
	"loss": 1.0321,
	"step": 3440
	},
	{
	"epoch": 0.18959943010575922,
	"grad_norm": 2.6031651496887207,
	"learning_rate": 0.0001,
	"loss": 0.9622,
	"step": 3460
	},
	{
	"epoch": 0.19069538056879828,
	"grad_norm": 1.962509274482727,
	"learning_rate": 0.0001,
	"loss": 1.0262,
	"step": 3480
	},
	{
	"epoch": 0.19179133103183735,
	"grad_norm": 2.794633626937866,
	"learning_rate": 0.0001,
	"loss": 1.0626,
	"step": 3500
	},
	{
	"epoch": 0.19288728149487644,
	"grad_norm": 2.4276185035705566,
	"learning_rate": 0.0001,
	"loss": 0.9961,
	"step": 3520
	},
	{
	"epoch": 0.1939832319579155,
	"grad_norm": 2.0747737884521484,
	"learning_rate": 0.0001,
	"loss": 0.8945,
	"step": 3540
	},
	{
	"epoch": 0.19507918242095457,
	"grad_norm": 1.9151681661605835,
	"learning_rate": 0.0001,
	"loss": 1.0664,
	"step": 3560
	},
	{
	"epoch": 0.19617513288399363,
	"grad_norm": 2.11547589302063,
	"learning_rate": 0.0001,
	"loss": 0.9865,
	"step": 3580
	},
	{
	"epoch": 0.19727108334703272,
	"grad_norm": 2.359848737716675,
	"learning_rate": 0.0001,
	"loss": 0.95,
	"step": 3600
	},
	{
	"epoch": 0.19836703381007179,
	"grad_norm": 1.9854378700256348,
	"learning_rate": 0.0001,
	"loss": 0.9992,
	"step": 3620
	},
	{
	"epoch": 0.19946298427311085,
	"grad_norm": 2.476423978805542,
	"learning_rate": 0.0001,
	"loss": 0.9097,
	"step": 3640
	},
	{
	"epoch": 0.2005589347361499,
	"grad_norm": 2.420011281967163,
	"learning_rate": 0.0001,
	"loss": 1.0167,
	"step": 3660
	},
	{
	"epoch": 0.201654885199189,
	"grad_norm": 2.12312388420105,
	"learning_rate": 0.0001,
	"loss": 0.9298,
	"step": 3680
	},
	{
	"epoch": 0.20275083566222807,
	"grad_norm": 1.9679986238479614,
	"learning_rate": 0.0001,
	"loss": 1.0064,
	"step": 3700
	},
	{
	"epoch": 0.20384678612526713,
	"grad_norm": 2.608135461807251,
	"learning_rate": 0.0001,
	"loss": 0.9396,
	"step": 3720
	},
	{
	"epoch": 0.2049427365883062,
	"grad_norm": 2.542102098464966,
	"learning_rate": 0.0001,
	"loss": 1.0868,
	"step": 3740
	},
	{
	"epoch": 0.2060386870513453,
	"grad_norm": 2.5252091884613037,
	"learning_rate": 0.0001,
	"loss": 1.0417,
	"step": 3760
	},
	{
	"epoch": 0.20713463751438435,
	"grad_norm": 1.98774254322052,
	"learning_rate": 0.0001,
	"loss": 0.9949,
	"step": 3780
	},
	{
	"epoch": 0.20823058797742341,
	"grad_norm": 1.9502965211868286,
	"learning_rate": 0.0001,
	"loss": 0.9862,
	"step": 3800
	},
	{
	"epoch": 0.20932653844046248,
	"grad_norm": 2.2537944316864014,
	"learning_rate": 0.0001,
	"loss": 0.9087,
	"step": 3820
	},
	{
	"epoch": 0.21042248890350157,
	"grad_norm": 2.2866523265838623,
	"learning_rate": 0.0001,
	"loss": 1.0128,
	"step": 3840
	},
	{
	"epoch": 0.21151843936654063,
	"grad_norm": 2.2907001972198486,
	"learning_rate": 0.0001,
	"loss": 0.9654,
	"step": 3860
	},
	{
	"epoch": 0.2126143898295797,
	"grad_norm": 2.5648560523986816,
	"learning_rate": 0.0001,
	"loss": 1.0269,
	"step": 3880
	},
	{
	"epoch": 0.21371034029261876,
	"grad_norm": 2.198974847793579,
	"learning_rate": 0.0001,
	"loss": 0.9823,
	"step": 3900
	},
	{
	"epoch": 0.21480629075565785,
	"grad_norm": 2.1045591831207275,
	"learning_rate": 0.0001,
	"loss": 0.9139,
	"step": 3920
	},
	{
	"epoch": 0.21590224121869692,
	"grad_norm": 2.1462857723236084,
	"learning_rate": 0.0001,
	"loss": 0.9406,
	"step": 3940
	},
	{
	"epoch": 0.21699819168173598,
	"grad_norm": 2.3216285705566406,
	"learning_rate": 0.0001,
	"loss": 0.8597,
	"step": 3960
	},
	{
	"epoch": 0.21809414214477504,
	"grad_norm": 1.867150068283081,
	"learning_rate": 0.0001,
	"loss": 0.9776,
	"step": 3980
	},
	{
	"epoch": 0.21919009260781414,
	"grad_norm": 2.3432791233062744,
	"learning_rate": 0.0001,
	"loss": 0.9546,
	"step": 4000
	},
	{
	"epoch": 0.21919009260781414,
	"eval_loss": 0.9323587417602539,
	"eval_runtime": 30935.2713,
	"eval_samples_per_second": 2.098,
	"eval_steps_per_second": 0.066,
	"eval_wer": 63.836951720973865,
	"step": 4000
	},
	{
	"epoch": 0.2202860430708532,
	"grad_norm": 1.9426536560058594,
	"learning_rate": 0.0001,
	"loss": 0.9291,
	"step": 4020
	},
	{
	"epoch": 0.22138199353389226,
	"grad_norm": 2.693723201751709,
	"learning_rate": 0.0001,
	"loss": 0.9072,
	"step": 4040
	},
	{
	"epoch": 0.22247794399693133,
	"grad_norm": 2.237900972366333,
	"learning_rate": 0.0001,
	"loss": 0.8571,
	"step": 4060
	},
	{
	"epoch": 0.22357389445997042,
	"grad_norm": 2.739129066467285,
	"learning_rate": 0.0001,
	"loss": 0.9132,
	"step": 4080
	},
	{
	"epoch": 0.22466984492300948,
	"grad_norm": 1.886438012123108,
	"learning_rate": 0.0001,
	"loss": 0.9646,
	"step": 4100
	},
	{
	"epoch": 0.22576579538604855,
	"grad_norm": 2.3505897521972656,
	"learning_rate": 0.0001,
	"loss": 1.0479,
	"step": 4120
	},
	{
	"epoch": 0.2268617458490876,
	"grad_norm": 2.4302868843078613,
	"learning_rate": 0.0001,
	"loss": 0.9956,
	"step": 4140
	},
	{
	"epoch": 0.2279576963121267,
	"grad_norm": 2.2747528553009033,
	"learning_rate": 0.0001,
	"loss": 0.9621,
	"step": 4160
	},
	{
	"epoch": 0.22905364677516576,
	"grad_norm": 2.312248945236206,
	"learning_rate": 0.0001,
	"loss": 0.9292,
	"step": 4180
	},
	{
	"epoch": 0.23014959723820483,
	"grad_norm": 2.0439066886901855,
	"learning_rate": 0.0001,
	"loss": 0.8804,
	"step": 4200
	},
	{
	"epoch": 0.2312455477012439,
	"grad_norm": 2.615898609161377,
	"learning_rate": 0.0001,
	"loss": 0.9302,
	"step": 4220
	},
	{
	"epoch": 0.23234149816428298,
	"grad_norm": 2.306796073913574,
	"learning_rate": 0.0001,
	"loss": 1.0401,
	"step": 4240
	},
	{
	"epoch": 0.23343744862732205,
	"grad_norm": 2.4527432918548584,
	"learning_rate": 0.0001,
	"loss": 0.9195,
	"step": 4260
	},
	{
	"epoch": 0.2345333990903611,
	"grad_norm": 1.8589290380477905,
	"learning_rate": 0.0001,
	"loss": 0.9284,
	"step": 4280
	},
	{
	"epoch": 0.23562934955340017,
	"grad_norm": 1.8492025136947632,
	"learning_rate": 0.0001,
	"loss": 0.8898,
	"step": 4300
	},
	{
	"epoch": 0.23672530001643927,
	"grad_norm": 2.574871063232422,
	"learning_rate": 0.0001,
	"loss": 1.0026,
	"step": 4320
	},
	{
	"epoch": 0.23782125047947833,
	"grad_norm": 2.2600936889648438,
	"learning_rate": 0.0001,
	"loss": 1.0738,
	"step": 4340
	},
	{
	"epoch": 0.2389172009425174,
	"grad_norm": 2.35066556930542,
	"learning_rate": 0.0001,
	"loss": 0.8573,
	"step": 4360
	},
	{
	"epoch": 0.24001315140555646,
	"grad_norm": 2.165745496749878,
	"learning_rate": 0.0001,
	"loss": 0.8989,
	"step": 4380
	},
	{
	"epoch": 0.24110910186859555,
	"grad_norm": 2.1494085788726807,
	"learning_rate": 0.0001,
	"loss": 0.8292,
	"step": 4400
	},
	{
	"epoch": 0.2422050523316346,
	"grad_norm": 2.185359239578247,
	"learning_rate": 0.0001,
	"loss": 0.8954,
	"step": 4420
	},
	{
	"epoch": 0.24330100279467368,
	"grad_norm": 2.193904161453247,
	"learning_rate": 0.0001,
	"loss": 0.8944,
	"step": 4440
	},
	{
	"epoch": 0.24439695325771274,
	"grad_norm": 2.1101438999176025,
	"learning_rate": 0.0001,
	"loss": 0.9059,
	"step": 4460
	},
	{
	"epoch": 0.24549290372075183,
	"grad_norm": 2.026642084121704,
	"learning_rate": 0.0001,
	"loss": 0.8978,
	"step": 4480
	},
	{
	"epoch": 0.2465888541837909,
	"grad_norm": 2.0481228828430176,
	"learning_rate": 0.0001,
	"loss": 0.8835,
	"step": 4500
	},
	{
	"epoch": 0.24768480464682996,
	"grad_norm": 2.201350688934326,
	"learning_rate": 0.0001,
	"loss": 0.9519,
	"step": 4520
	},
	{
	"epoch": 0.24878075510986902,
	"grad_norm": 1.852100133895874,
	"learning_rate": 0.0001,
	"loss": 0.8458,
	"step": 4540
	},
	{
	"epoch": 0.24987670557290811,
	"grad_norm": 2.1303794384002686,
	"learning_rate": 0.0001,
	"loss": 0.9092,
	"step": 4560
	},
	{
	"epoch": 0.25097265603594715,
	"grad_norm": 2.2715415954589844,
	"learning_rate": 0.0001,
	"loss": 0.8931,
	"step": 4580
	},
	{
	"epoch": 0.25206860649898627,
	"grad_norm": 2.091785192489624,
	"learning_rate": 0.0001,
	"loss": 0.8645,
	"step": 4600
	},
	{
	"epoch": 0.25316455696202533,
	"grad_norm": 2.108103036880493,
	"learning_rate": 0.0001,
	"loss": 0.8387,
	"step": 4620
	},
	{
	"epoch": 0.2542605074250644,
	"grad_norm": 2.083848237991333,
	"learning_rate": 0.0001,
	"loss": 0.8315,
	"step": 4640
	},
	{
	"epoch": 0.25535645788810346,
	"grad_norm": 1.570475459098816,
	"learning_rate": 0.0001,
	"loss": 0.9355,
	"step": 4660
	},
	{
	"epoch": 0.2564524083511425,
	"grad_norm": 1.90199875831604,
	"learning_rate": 0.0001,
	"loss": 0.8308,
	"step": 4680
	},
	{
	"epoch": 0.2575483588141816,
	"grad_norm": 2.1952812671661377,
	"learning_rate": 0.0001,
	"loss": 0.8618,
	"step": 4700
	},
	{
	"epoch": 0.25864430927722065,
	"grad_norm": 2.0530431270599365,
	"learning_rate": 0.0001,
	"loss": 0.7951,
	"step": 4720
	},
	{
	"epoch": 0.2597402597402597,
	"grad_norm": 2.202252149581909,
	"learning_rate": 0.0001,
	"loss": 0.8858,
	"step": 4740
	},
	{
	"epoch": 0.26083621020329883,
	"grad_norm": 1.9541796445846558,
	"learning_rate": 0.0001,
	"loss": 0.8466,
	"step": 4760
	},
	{
	"epoch": 0.2619321606663379,
	"grad_norm": 1.9440534114837646,
	"learning_rate": 0.0001,
	"loss": 0.8488,
	"step": 4780
	},
	{
	"epoch": 0.26302811112937696,
	"grad_norm": 2.569821834564209,
	"learning_rate": 0.0001,
	"loss": 0.963,
	"step": 4800
	},
	{
	"epoch": 0.264124061592416,
	"grad_norm": 1.8896031379699707,
	"learning_rate": 0.0001,
	"loss": 0.837,
	"step": 4820
	},
	{
	"epoch": 0.2652200120554551,
	"grad_norm": 1.9390859603881836,
	"learning_rate": 0.0001,
	"loss": 0.8855,
	"step": 4840
	},
	{
	"epoch": 0.26631596251849415,
	"grad_norm": 2.2261974811553955,
	"learning_rate": 0.0001,
	"loss": 0.8901,
	"step": 4860
	},
	{
	"epoch": 0.2674119129815332,
	"grad_norm": 2.0486056804656982,
	"learning_rate": 0.0001,
	"loss": 0.8073,
	"step": 4880
	},
	{
	"epoch": 0.2685078634445723,
	"grad_norm": 2.292015314102173,
	"learning_rate": 0.0001,
	"loss": 0.9492,
	"step": 4900
	},
	{
	"epoch": 0.2696038139076114,
	"grad_norm": 2.0762240886688232,
	"learning_rate": 0.0001,
	"loss": 0.8528,
	"step": 4920
	},
	{
	"epoch": 0.27069976437065046,
	"grad_norm": 1.870642066001892,
	"learning_rate": 0.0001,
	"loss": 0.9482,
	"step": 4940
	},
	{
	"epoch": 0.27179571483368953,
	"grad_norm": 2.436768054962158,
	"learning_rate": 0.0001,
	"loss": 0.9299,
	"step": 4960
	},
	{
	"epoch": 0.2728916652967286,
	"grad_norm": 2.505880832672119,
	"learning_rate": 0.0001,
	"loss": 0.9259,
	"step": 4980
	},
	{
	"epoch": 0.27398761575976766,
	"grad_norm": 1.717252492904663,
	"learning_rate": 0.0001,
	"loss": 0.8134,
	"step": 5000
	},
	{
	"epoch": 0.27398761575976766,
	"eval_loss": 0.8726964592933655,
	"eval_runtime": 30710.3822,
	"eval_samples_per_second": 2.113,
	"eval_steps_per_second": 0.066,
	"eval_wer": 52.213316533880224,
	"step": 5000
	},
	{
	"epoch": 0.2750835662228067,
	"grad_norm": 2.28765869140625,
	"learning_rate": 0.0001,
	"loss": 1.0229,
	"step": 5020
	},
	{
	"epoch": 0.2761795166858458,
	"grad_norm": 2.2264580726623535,
	"learning_rate": 0.0001,
	"loss": 0.8291,
	"step": 5040
	},
	{
	"epoch": 0.27727546714888485,
	"grad_norm": 1.9387757778167725,
	"learning_rate": 0.0001,
	"loss": 0.821,
	"step": 5060
	},
	{
	"epoch": 0.27837141761192397,
	"grad_norm": 2.8628933429718018,
	"learning_rate": 0.0001,
	"loss": 0.9521,
	"step": 5080
	},
	{
	"epoch": 0.27946736807496303,
	"grad_norm": 2.2691447734832764,
	"learning_rate": 0.0001,
	"loss": 0.8182,
	"step": 5100
	},
	{
	"epoch": 0.2805633185380021,
	"grad_norm": 1.9515260457992554,
	"learning_rate": 0.0001,
	"loss": 0.9342,
	"step": 5120
	},
	{
	"epoch": 0.28165926900104116,
	"grad_norm": 2.1714837551116943,
	"learning_rate": 0.0001,
	"loss": 0.9663,
	"step": 5140
	},
	{
	"epoch": 0.2827552194640802,
	"grad_norm": 2.0159664154052734,
	"learning_rate": 0.0001,
	"loss": 0.8294,
	"step": 5160
	},
	{
	"epoch": 0.2838511699271193,
	"grad_norm": 2.024634599685669,
	"learning_rate": 0.0001,
	"loss": 0.896,
	"step": 5180
	},
	{
	"epoch": 0.28494712039015835,
	"grad_norm": 2.0035595893859863,
	"learning_rate": 0.0001,
	"loss": 0.8446,
	"step": 5200
	},
	{
	"epoch": 0.2860430708531974,
	"grad_norm": 2.4142866134643555,
	"learning_rate": 0.0001,
	"loss": 0.8835,
	"step": 5220
	},
	{
	"epoch": 0.28713902131623653,
	"grad_norm": 2.070338010787964,
	"learning_rate": 0.0001,
	"loss": 0.8687,
	"step": 5240
	},
	{
	"epoch": 0.2882349717792756,
	"grad_norm": 1.9818578958511353,
	"learning_rate": 0.0001,
	"loss": 0.8296,
	"step": 5260
	},
	{
	"epoch": 0.28933092224231466,
	"grad_norm": 1.8923412561416626,
	"learning_rate": 0.0001,
	"loss": 0.8999,
	"step": 5280
	},
	{
	"epoch": 0.2904268727053537,
	"grad_norm": 2.200206995010376,
	"learning_rate": 0.0001,
	"loss": 0.8662,
	"step": 5300
	},
	{
	"epoch": 0.2915228231683928,
	"grad_norm": 1.982446551322937,
	"learning_rate": 0.0001,
	"loss": 0.8301,
	"step": 5320
	},
	{
	"epoch": 0.29261877363143185,
	"grad_norm": 1.934844732284546,
	"learning_rate": 0.0001,
	"loss": 0.8219,
	"step": 5340
	},
	{
	"epoch": 0.2937147240944709,
	"grad_norm": 2.2790510654449463,
	"learning_rate": 0.0001,
	"loss": 0.8666,
	"step": 5360
	},
	{
	"epoch": 0.29481067455751,
	"grad_norm": 1.771672248840332,
	"learning_rate": 0.0001,
	"loss": 0.843,
	"step": 5380
	},
	{
	"epoch": 0.2959066250205491,
	"grad_norm": 2.3459877967834473,
	"learning_rate": 0.0001,
	"loss": 0.8516,
	"step": 5400
	},
	{
	"epoch": 0.29700257548358816,
	"grad_norm": 2.156458854675293,
	"learning_rate": 0.0001,
	"loss": 0.8425,
	"step": 5420
	},
	{
	"epoch": 0.2980985259466272,
	"grad_norm": 1.9492950439453125,
	"learning_rate": 0.0001,
	"loss": 0.8445,
	"step": 5440
	},
	{
	"epoch": 0.2991944764096663,
	"grad_norm": 2.1061997413635254,
	"learning_rate": 0.0001,
	"loss": 0.8858,
	"step": 5460
	},
	{
	"epoch": 0.30029042687270535,
	"grad_norm": 2.3567299842834473,
	"learning_rate": 0.0001,
	"loss": 0.8376,
	"step": 5480
	},
	{
	"epoch": 0.3013863773357444,
	"grad_norm": 2.1302335262298584,
	"learning_rate": 0.0001,
	"loss": 0.8272,
	"step": 5500
	},
	{
	"epoch": 0.3024823277987835,
	"grad_norm": 2.2098424434661865,
	"learning_rate": 0.0001,
	"loss": 0.8742,
	"step": 5520
	},
	{
	"epoch": 0.30357827826182254,
	"grad_norm": 1.7558562755584717,
	"learning_rate": 0.0001,
	"loss": 0.8863,
	"step": 5540
	},
	{
	"epoch": 0.30467422872486166,
	"grad_norm": 1.8461397886276245,
	"learning_rate": 0.0001,
	"loss": 0.8792,
	"step": 5560
	},
	{
	"epoch": 0.3057701791879007,
	"grad_norm": 2.0006344318389893,
	"learning_rate": 0.0001,
	"loss": 0.8263,
	"step": 5580
	},
	{
	"epoch": 0.3068661296509398,
	"grad_norm": 1.6772565841674805,
	"learning_rate": 0.0001,
	"loss": 0.789,
	"step": 5600
	},
	{
	"epoch": 0.30796208011397885,
	"grad_norm": 1.9263228178024292,
	"learning_rate": 0.0001,
	"loss": 0.842,
	"step": 5620
	},
	{
	"epoch": 0.3090580305770179,
	"grad_norm": 1.8888592720031738,
	"learning_rate": 0.0001,
	"loss": 0.8475,
	"step": 5640
	},
	{
	"epoch": 0.310153981040057,
	"grad_norm": 2.2354602813720703,
	"learning_rate": 0.0001,
	"loss": 1.0036,
	"step": 5660
	},
	{
	"epoch": 0.31124993150309604,
	"grad_norm": 1.9634332656860352,
	"learning_rate": 0.0001,
	"loss": 0.8517,
	"step": 5680
	},
	{
	"epoch": 0.3123458819661351,
	"grad_norm": 2.348825216293335,
	"learning_rate": 0.0001,
	"loss": 0.8731,
	"step": 5700
	},
	{
	"epoch": 0.3134418324291742,
	"grad_norm": 2.487741708755493,
	"learning_rate": 0.0001,
	"loss": 0.8556,
	"step": 5720
	},
	{
	"epoch": 0.3145377828922133,
	"grad_norm": 1.999516248703003,
	"learning_rate": 0.0001,
	"loss": 0.7969,
	"step": 5740
	},
	{
	"epoch": 0.31563373335525235,
	"grad_norm": 1.9654616117477417,
	"learning_rate": 0.0001,
	"loss": 0.7843,
	"step": 5760
	},
	{
	"epoch": 0.3167296838182914,
	"grad_norm": 2.1070950031280518,
	"learning_rate": 0.0001,
	"loss": 0.8399,
	"step": 5780
	},
	{
	"epoch": 0.3178256342813305,
	"grad_norm": 2.257129192352295,
	"learning_rate": 0.0001,
	"loss": 0.8224,
	"step": 5800
	},
	{
	"epoch": 0.31892158474436955,
	"grad_norm": 1.8256118297576904,
	"learning_rate": 0.0001,
	"loss": 0.794,
	"step": 5820
	},
	{
	"epoch": 0.3200175352074086,
	"grad_norm": 1.8899625539779663,
	"learning_rate": 0.0001,
	"loss": 0.8614,
	"step": 5840
	},
	{
	"epoch": 0.3211134856704477,
	"grad_norm": 2.221484661102295,
	"learning_rate": 0.0001,
	"loss": 0.765,
	"step": 5860
	},
	{
	"epoch": 0.3222094361334868,
	"grad_norm": 1.796877384185791,
	"learning_rate": 0.0001,
	"loss": 0.8359,
	"step": 5880
	},
	{
	"epoch": 0.32330538659652586,
	"grad_norm": 1.7495447397232056,
	"learning_rate": 0.0001,
	"loss": 0.8688,
	"step": 5900
	},
	{
	"epoch": 0.3244013370595649,
	"grad_norm": 2.136664628982544,
	"learning_rate": 0.0001,
	"loss": 0.9163,
	"step": 5920
	},
	{
	"epoch": 0.325497287522604,
	"grad_norm": 1.8508238792419434,
	"learning_rate": 0.0001,
	"loss": 0.7975,
	"step": 5940
	},
	{
	"epoch": 0.32659323798564305,
	"grad_norm": 2.144523859024048,
	"learning_rate": 0.0001,
	"loss": 0.7749,
	"step": 5960
	},
	{
	"epoch": 0.3276891884486821,
	"grad_norm": 2.208815336227417,
	"learning_rate": 0.0001,
	"loss": 0.8148,
	"step": 5980
	},
	{
	"epoch": 0.3287851389117212,
	"grad_norm": 2.0617401599884033,
	"learning_rate": 0.0001,
	"loss": 0.8884,
	"step": 6000
	},
	{
	"epoch": 0.3287851389117212,
	"eval_loss": 0.8316722512245178,
	"eval_runtime": 30850.8589,
	"eval_samples_per_second": 2.103,
	"eval_steps_per_second": 0.066,
	"eval_wer": 45.9960352377659,
	"step": 6000
	},
	{
	"epoch": 0.32988108937476024,
	"grad_norm": 2.0406434535980225,
	"learning_rate": 0.0001,
	"loss": 0.8504,
	"step": 6020
	},
	{
	"epoch": 0.33097703983779936,
	"grad_norm": 2.1899139881134033,
	"learning_rate": 0.0001,
	"loss": 0.7782,
	"step": 6040
	},
	{
	"epoch": 0.3320729903008384,
	"grad_norm": 2.650421380996704,
	"learning_rate": 0.0001,
	"loss": 0.7823,
	"step": 6060
	},
	{
	"epoch": 0.3331689407638775,
	"grad_norm": 2.085683584213257,
	"learning_rate": 0.0001,
	"loss": 0.754,
	"step": 6080
	},
	{
	"epoch": 0.33426489122691655,
	"grad_norm": 2.1783502101898193,
	"learning_rate": 0.0001,
	"loss": 0.8819,
	"step": 6100
	},
	{
	"epoch": 0.3353608416899556,
	"grad_norm": 2.096208333969116,
	"learning_rate": 0.0001,
	"loss": 0.8702,
	"step": 6120
	},
	{
	"epoch": 0.3364567921529947,
	"grad_norm": 2.005629062652588,
	"learning_rate": 0.0001,
	"loss": 0.8827,
	"step": 6140
	},
	{
	"epoch": 0.33755274261603374,
	"grad_norm": 2.1545634269714355,
	"learning_rate": 0.0001,
	"loss": 0.8496,
	"step": 6160
	},
	{
	"epoch": 0.3386486930790728,
	"grad_norm": 1.8190851211547852,
	"learning_rate": 0.0001,
	"loss": 0.7622,
	"step": 6180
	},
	{
	"epoch": 0.3397446435421119,
	"grad_norm": 1.9555623531341553,
	"learning_rate": 0.0001,
	"loss": 0.8338,
	"step": 6200
	},
	{
	"epoch": 0.340840594005151,
	"grad_norm": 1.8530341386795044,
	"learning_rate": 0.0001,
	"loss": 0.8017,
	"step": 6220
	},
	{
	"epoch": 0.34193654446819005,
	"grad_norm": 1.8724114894866943,
	"learning_rate": 0.0001,
	"loss": 0.848,
	"step": 6240
	},
	{
	"epoch": 0.3430324949312291,
	"grad_norm": 1.8598796129226685,
	"learning_rate": 0.0001,
	"loss": 0.8074,
	"step": 6260
	},
	{
	"epoch": 0.3441284453942682,
	"grad_norm": 2.1442923545837402,
	"learning_rate": 0.0001,
	"loss": 0.8473,
	"step": 6280
	},
	{
	"epoch": 0.34522439585730724,
	"grad_norm": 2.3083174228668213,
	"learning_rate": 0.0001,
	"loss": 0.9016,
	"step": 6300
	},
	{
	"epoch": 0.3463203463203463,
	"grad_norm": 1.8194735050201416,
	"learning_rate": 0.0001,
	"loss": 0.8267,
	"step": 6320
	},
	{
	"epoch": 0.34741629678338537,
	"grad_norm": 2.063523054122925,
	"learning_rate": 0.0001,
	"loss": 0.7841,
	"step": 6340
	},
	{
	"epoch": 0.3485122472464245,
	"grad_norm": 2.17594051361084,
	"learning_rate": 0.0001,
	"loss": 0.8318,
	"step": 6360
	},
	{
	"epoch": 0.34960819770946355,
	"grad_norm": 1.665189504623413,
	"learning_rate": 0.0001,
	"loss": 0.7983,
	"step": 6380
	},
	{
	"epoch": 0.3507041481725026,
	"grad_norm": 2.2596445083618164,
	"learning_rate": 0.0001,
	"loss": 0.8421,
	"step": 6400
	},
	{
	"epoch": 0.3518000986355417,
	"grad_norm": 1.7096545696258545,
	"learning_rate": 0.0001,
	"loss": 0.889,
	"step": 6420
	},
	{
	"epoch": 0.35289604909858074,
	"grad_norm": 1.7475535869598389,
	"learning_rate": 0.0001,
	"loss": 0.8006,
	"step": 6440
	},
	{
	"epoch": 0.3539919995616198,
	"grad_norm": 1.8176007270812988,
	"learning_rate": 0.0001,
	"loss": 0.8632,
	"step": 6460
	},
	{
	"epoch": 0.35508795002465887,
	"grad_norm": 2.6806535720825195,
	"learning_rate": 0.0001,
	"loss": 0.8427,
	"step": 6480
	},
	{
	"epoch": 0.35618390048769794,
	"grad_norm": 2.094172477722168,
	"learning_rate": 0.0001,
	"loss": 0.7812,
	"step": 6500
	},
	{
	"epoch": 0.357279850950737,
	"grad_norm": 1.8341765403747559,
	"learning_rate": 0.0001,
	"loss": 0.8051,
	"step": 6520
	},
	{
	"epoch": 0.3583758014137761,
	"grad_norm": 2.2341349124908447,
	"learning_rate": 0.0001,
	"loss": 0.8001,
	"step": 6540
	},
	{
	"epoch": 0.3594717518768152,
	"grad_norm": 2.1017801761627197,
	"learning_rate": 0.0001,
	"loss": 0.8142,
	"step": 6560
	},
	{
	"epoch": 0.36056770233985425,
	"grad_norm": 1.9903994798660278,
	"learning_rate": 0.0001,
	"loss": 0.8117,
	"step": 6580
	},
	{
	"epoch": 0.3616636528028933,
	"grad_norm": 2.273465394973755,
	"learning_rate": 0.0001,
	"loss": 0.8864,
	"step": 6600
	},
	{
	"epoch": 0.3627596032659324,
	"grad_norm": 2.0767428874969482,
	"learning_rate": 0.0001,
	"loss": 0.7687,
	"step": 6620
	},
	{
	"epoch": 0.36385555372897144,
	"grad_norm": 2.559774398803711,
	"learning_rate": 0.0001,
	"loss": 0.8181,
	"step": 6640
	},
	{
	"epoch": 0.3649515041920105,
	"grad_norm": 2.1393582820892334,
	"learning_rate": 0.0001,
	"loss": 0.7936,
	"step": 6660
	},
	{
	"epoch": 0.36604745465504956,
	"grad_norm": 2.06675386428833,
	"learning_rate": 0.0001,
	"loss": 0.8263,
	"step": 6680
	},
	{
	"epoch": 0.3671434051180887,
	"grad_norm": 1.7674784660339355,
	"learning_rate": 0.0001,
	"loss": 0.7818,
	"step": 6700
	},
	{
	"epoch": 0.36823935558112775,
	"grad_norm": 1.765442132949829,
	"learning_rate": 0.0001,
	"loss": 0.8335,
	"step": 6720
	},
	{
	"epoch": 0.3693353060441668,
	"grad_norm": 2.044288158416748,
	"learning_rate": 0.0001,
	"loss": 0.8742,
	"step": 6740
	},
	{
	"epoch": 0.3704312565072059,
	"grad_norm": 1.9821726083755493,
	"learning_rate": 0.0001,
	"loss": 0.928,
	"step": 6760
	},
	{
	"epoch": 0.37152720697024494,
	"grad_norm": 2.0798370838165283,
	"learning_rate": 0.0001,
	"loss": 0.7627,
	"step": 6780
	},
	{
	"epoch": 0.372623157433284,
	"grad_norm": 1.6817582845687866,
	"learning_rate": 0.0001,
	"loss": 0.7985,
	"step": 6800
	},
	{
	"epoch": 0.37371910789632307,
	"grad_norm": 1.872247576713562,
	"learning_rate": 0.0001,
	"loss": 0.8102,
	"step": 6820
	},
	{
	"epoch": 0.37481505835936213,
	"grad_norm": 1.7761516571044922,
	"learning_rate": 0.0001,
	"loss": 0.8435,
	"step": 6840
	},
	{
	"epoch": 0.37591100882240125,
	"grad_norm": 1.739585518836975,
	"learning_rate": 0.0001,
	"loss": 0.8706,
	"step": 6860
	},
	{
	"epoch": 0.3770069592854403,
	"grad_norm": 2.0503687858581543,
	"learning_rate": 0.0001,
	"loss": 0.8354,
	"step": 6880
	},
	{
	"epoch": 0.3781029097484794,
	"grad_norm": 2.283393621444702,
	"learning_rate": 0.0001,
	"loss": 0.7476,
	"step": 6900
	},
	{
	"epoch": 0.37919886021151844,
	"grad_norm": 1.801018238067627,
	"learning_rate": 0.0001,
	"loss": 0.7817,
	"step": 6920
	},
	{
	"epoch": 0.3802948106745575,
	"grad_norm": 2.5343267917633057,
	"learning_rate": 0.0001,
	"loss": 0.7628,
	"step": 6940
	},
	{
	"epoch": 0.38139076113759657,
	"grad_norm": 2.010507822036743,
	"learning_rate": 0.0001,
	"loss": 0.7931,
	"step": 6960
	},
	{
	"epoch": 0.38248671160063563,
	"grad_norm": 1.7228796482086182,
	"learning_rate": 0.0001,
	"loss": 0.7517,
	"step": 6980
	},
	{
	"epoch": 0.3835826620636747,
	"grad_norm": 1.967822551727295,
	"learning_rate": 0.0001,
	"loss": 0.804,
	"step": 7000
	},
	{
	"epoch": 0.3835826620636747,
	"eval_loss": 0.7978512644767761,
	"eval_runtime": 30977.7517,
	"eval_samples_per_second": 2.095,
	"eval_steps_per_second": 0.065,
	"eval_wer": 61.261910549759826,
	"step": 7000
	},
	{
	"epoch": 0.3846786125267138,
	"grad_norm": 1.9999229907989502,
	"learning_rate": 0.0001,
	"loss": 0.7634,
	"step": 7020
	},
	{
	"epoch": 0.3857745629897529,
	"grad_norm": 1.956128716468811,
	"learning_rate": 0.0001,
	"loss": 0.8102,
	"step": 7040
	},
	{
	"epoch": 0.38687051345279194,
	"grad_norm": 2.0134966373443604,
	"learning_rate": 0.0001,
	"loss": 0.7957,
	"step": 7060
	},
	{
	"epoch": 0.387966463915831,
	"grad_norm": 2.0373167991638184,
	"learning_rate": 0.0001,
	"loss": 0.8251,
	"step": 7080
	},
	{
	"epoch": 0.38906241437887007,
	"grad_norm": 1.7772964239120483,
	"learning_rate": 0.0001,
	"loss": 0.8128,
	"step": 7100
	},
	{
	"epoch": 0.39015836484190913,
	"grad_norm": 1.7618379592895508,
	"learning_rate": 0.0001,
	"loss": 0.8345,
	"step": 7120
	},
	{
	"epoch": 0.3912543153049482,
	"grad_norm": 2.181671380996704,
	"learning_rate": 0.0001,
	"loss": 0.8345,
	"step": 7140
	},
	{
	"epoch": 0.39235026576798726,
	"grad_norm": 1.8794726133346558,
	"learning_rate": 0.0001,
	"loss": 0.7615,
	"step": 7160
	},
	{
	"epoch": 0.3934462162310264,
	"grad_norm": 1.9297798871994019,
	"learning_rate": 0.0001,
	"loss": 0.7618,
	"step": 7180
	},
	{
	"epoch": 0.39454216669406544,
	"grad_norm": 1.9441471099853516,
	"learning_rate": 0.0001,
	"loss": 0.859,
	"step": 7200
	},
	{
	"epoch": 0.3956381171571045,
	"grad_norm": 2.2561404705047607,
	"learning_rate": 0.0001,
	"loss": 0.7877,
	"step": 7220
	},
	{
	"epoch": 0.39673406762014357,
	"grad_norm": 1.8441416025161743,
	"learning_rate": 0.0001,
	"loss": 0.7734,
	"step": 7240
	},
	{
	"epoch": 0.39783001808318263,
	"grad_norm": 1.686120867729187,
	"learning_rate": 0.0001,
	"loss": 0.7066,
	"step": 7260
	},
	{
	"epoch": 0.3989259685462217,
	"grad_norm": 1.9456263780593872,
	"learning_rate": 0.0001,
	"loss": 0.7469,
	"step": 7280
	},
	{
	"epoch": 0.40002191900926076,
	"grad_norm": 1.9112725257873535,
	"learning_rate": 0.0001,
	"loss": 0.7607,
	"step": 7300
	},
	{
	"epoch": 0.4011178694722998,
	"grad_norm": 2.5668513774871826,
	"learning_rate": 0.0001,
	"loss": 0.7859,
	"step": 7320
	},
	{
	"epoch": 0.40221381993533895,
	"grad_norm": 1.9502942562103271,
	"learning_rate": 0.0001,
	"loss": 0.7607,
	"step": 7340
	},
	{
	"epoch": 0.403309770398378,
	"grad_norm": 1.6973525285720825,
	"learning_rate": 0.0001,
	"loss": 0.8313,
	"step": 7360
	},
	{
	"epoch": 0.4044057208614171,
	"grad_norm": 2.3962297439575195,
	"learning_rate": 0.0001,
	"loss": 0.7806,
	"step": 7380
	},
	{
	"epoch": 0.40550167132445614,
	"grad_norm": 1.887536883354187,
	"learning_rate": 0.0001,
	"loss": 0.7524,
	"step": 7400
	},
	{
	"epoch": 0.4065976217874952,
	"grad_norm": 1.999687910079956,
	"learning_rate": 0.0001,
	"loss": 0.7349,
	"step": 7420
	},
	{
	"epoch": 0.40769357225053426,
	"grad_norm": 1.7444576025009155,
	"learning_rate": 0.0001,
	"loss": 0.8156,
	"step": 7440
	},
	{
	"epoch": 0.40878952271357333,
	"grad_norm": 1.7175132036209106,
	"learning_rate": 0.0001,
	"loss": 0.7419,
	"step": 7460
	},
	{
	"epoch": 0.4098854731766124,
	"grad_norm": 2.23638653755188,
	"learning_rate": 0.0001,
	"loss": 0.666,
	"step": 7480
	},
	{
	"epoch": 0.4109814236396515,
	"grad_norm": 2.024102210998535,
	"learning_rate": 0.0001,
	"loss": 0.7541,
	"step": 7500
	},
	{
	"epoch": 0.4120773741026906,
	"grad_norm": 2.042541265487671,
	"learning_rate": 0.0001,
	"loss": 0.7915,
	"step": 7520
	},
	{
	"epoch": 0.41317332456572964,
	"grad_norm": 1.9140897989273071,
	"learning_rate": 0.0001,
	"loss": 0.8712,
	"step": 7540
	},
	{
	"epoch": 0.4142692750287687,
	"grad_norm": 1.8435416221618652,
	"learning_rate": 0.0001,
	"loss": 0.8241,
	"step": 7560
	},
	{
	"epoch": 0.41536522549180777,
	"grad_norm": 2.027944803237915,
	"learning_rate": 0.0001,
	"loss": 0.9422,
	"step": 7580
	},
	{
	"epoch": 0.41646117595484683,
	"grad_norm": 2.07381534576416,
	"learning_rate": 0.0001,
	"loss": 0.812,
	"step": 7600
	},
	{
	"epoch": 0.4175571264178859,
	"grad_norm": 1.9762136936187744,
	"learning_rate": 0.0001,
	"loss": 0.7852,
	"step": 7620
	},
	{
	"epoch": 0.41865307688092496,
	"grad_norm": 1.8222426176071167,
	"learning_rate": 0.0001,
	"loss": 0.752,
	"step": 7640
	},
	{
	"epoch": 0.4197490273439641,
	"grad_norm": 2.0519089698791504,
	"learning_rate": 0.0001,
	"loss": 0.8031,
	"step": 7660
	},
	{
	"epoch": 0.42084497780700314,
	"grad_norm": 1.8777110576629639,
	"learning_rate": 0.0001,
	"loss": 0.8173,
	"step": 7680
	},
	{
	"epoch": 0.4219409282700422,
	"grad_norm": 2.323411703109741,
	"learning_rate": 0.0001,
	"loss": 0.8479,
	"step": 7700
	},
	{
	"epoch": 0.42303687873308127,
	"grad_norm": 1.6403400897979736,
	"learning_rate": 0.0001,
	"loss": 0.7567,
	"step": 7720
	},
	{
	"epoch": 0.42413282919612033,
	"grad_norm": 1.6627925634384155,
	"learning_rate": 0.0001,
	"loss": 0.7734,
	"step": 7740
	},
	{
	"epoch": 0.4252287796591594,
	"grad_norm": 1.8771709203720093,
	"learning_rate": 0.0001,
	"loss": 0.7652,
	"step": 7760
	},
	{
	"epoch": 0.42632473012219846,
	"grad_norm": 1.9806597232818604,
	"learning_rate": 0.0001,
	"loss": 0.7699,
	"step": 7780
	},
	{
	"epoch": 0.4274206805852375,
	"grad_norm": 2.1376988887786865,
	"learning_rate": 0.0001,
	"loss": 0.7825,
	"step": 7800
	},
	{
	"epoch": 0.42851663104827664,
	"grad_norm": 1.5566449165344238,
	"learning_rate": 0.0001,
	"loss": 0.704,
	"step": 7820
	},
	{
	"epoch": 0.4296125815113157,
	"grad_norm": 2.1835947036743164,
	"learning_rate": 0.0001,
	"loss": 0.8101,
	"step": 7840
	},
	{
	"epoch": 0.43070853197435477,
	"grad_norm": 2.055119037628174,
	"learning_rate": 0.0001,
	"loss": 0.703,
	"step": 7860
	},
	{
	"epoch": 0.43180448243739383,
	"grad_norm": 1.9324967861175537,
	"learning_rate": 0.0001,
	"loss": 0.81,
	"step": 7880
	},
	{
	"epoch": 0.4329004329004329,
	"grad_norm": 2.1087846755981445,
	"learning_rate": 0.0001,
	"loss": 0.7676,
	"step": 7900
	},
	{
	"epoch": 0.43399638336347196,
	"grad_norm": 1.8521897792816162,
	"learning_rate": 0.0001,
	"loss": 0.7546,
	"step": 7920
	},
	{
	"epoch": 0.435092333826511,
	"grad_norm": 2.145947217941284,
	"learning_rate": 0.0001,
	"loss": 0.7992,
	"step": 7940
	},
	{
	"epoch": 0.4361882842895501,
	"grad_norm": 1.7739931344985962,
	"learning_rate": 0.0001,
	"loss": 0.7133,
	"step": 7960
	},
	{
	"epoch": 0.4372842347525892,
	"grad_norm": 1.6032921075820923,
	"learning_rate": 0.0001,
	"loss": 0.8207,
	"step": 7980
	},
	{
	"epoch": 0.43838018521562827,
	"grad_norm": 2.1895668506622314,
	"learning_rate": 0.0001,
	"loss": 0.7638,
	"step": 8000
	},
	{
	"epoch": 0.43838018521562827,
	"eval_loss": 0.770411491394043,
	"eval_runtime": 30675.7059,
	"eval_samples_per_second": 2.115,
	"eval_steps_per_second": 0.066,
	"eval_wer": 43.10069742838263,
	"step": 8000
	},
	{
	"epoch": 0.43947613567866733,
	"grad_norm": 1.9759962558746338,
	"learning_rate": 0.0001,
	"loss": 0.7792,
	"step": 8020
	},
	{
	"epoch": 0.4405720861417064,
	"grad_norm": 1.845012903213501,
	"learning_rate": 0.0001,
	"loss": 0.847,
	"step": 8040
	},
	{
	"epoch": 0.44166803660474546,
	"grad_norm": 1.9666188955307007,
	"learning_rate": 0.0001,
	"loss": 0.767,
	"step": 8060
	},
	{
	"epoch": 0.4427639870677845,
	"grad_norm": 2.1448235511779785,
	"learning_rate": 0.0001,
	"loss": 0.7924,
	"step": 8080
	},
	{
	"epoch": 0.4438599375308236,
	"grad_norm": 1.9017919301986694,
	"learning_rate": 0.0001,
	"loss": 0.7239,
	"step": 8100
	},
	{
	"epoch": 0.44495588799386265,
	"grad_norm": 1.8005828857421875,
	"learning_rate": 0.0001,
	"loss": 0.7202,
	"step": 8120
	},
	{
	"epoch": 0.4460518384569018,
	"grad_norm": 1.7341022491455078,
	"learning_rate": 0.0001,
	"loss": 0.7045,
	"step": 8140
	},
	{
	"epoch": 0.44714778891994084,
	"grad_norm": 2.094618320465088,
	"learning_rate": 0.0001,
	"loss": 0.8067,
	"step": 8160
	},
	{
	"epoch": 0.4482437393829799,
	"grad_norm": 2.0414187908172607,
	"learning_rate": 0.0001,
	"loss": 0.6888,
	"step": 8180
	},
	{
	"epoch": 0.44933968984601896,
	"grad_norm": 1.8842118978500366,
	"learning_rate": 0.0001,
	"loss": 0.7125,
	"step": 8200
	},
	{
	"epoch": 0.450435640309058,
	"grad_norm": 1.9878696203231812,
	"learning_rate": 0.0001,
	"loss": 0.723,
	"step": 8220
	},
	{
	"epoch": 0.4515315907720971,
	"grad_norm": 1.94351065158844,
	"learning_rate": 0.0001,
	"loss": 0.727,
	"step": 8240
	},
	{
	"epoch": 0.45262754123513615,
	"grad_norm": 1.900718331336975,
	"learning_rate": 0.0001,
	"loss": 0.7306,
	"step": 8260
	},
	{
	"epoch": 0.4537234916981752,
	"grad_norm": 2.5974204540252686,
	"learning_rate": 0.0001,
	"loss": 0.7968,
	"step": 8280
	},
	{
	"epoch": 0.45481944216121434,
	"grad_norm": 1.9214075803756714,
	"learning_rate": 0.0001,
	"loss": 0.7767,
	"step": 8300
	},
	{
	"epoch": 0.4559153926242534,
	"grad_norm": 2.6079931259155273,
	"learning_rate": 0.0001,
	"loss": 0.7787,
	"step": 8320
	},
	{
	"epoch": 0.45701134308729247,
	"grad_norm": 1.8398691415786743,
	"learning_rate": 0.0001,
	"loss": 0.7941,
	"step": 8340
	},
	{
	"epoch": 0.45810729355033153,
	"grad_norm": 1.740376591682434,
	"learning_rate": 0.0001,
	"loss": 0.7714,
	"step": 8360
	},
	{
	"epoch": 0.4592032440133706,
	"grad_norm": 2.109416961669922,
	"learning_rate": 0.0001,
	"loss": 0.8015,
	"step": 8380
	},
	{
	"epoch": 0.46029919447640966,
	"grad_norm": 1.9565001726150513,
	"learning_rate": 0.0001,
	"loss": 0.7473,
	"step": 8400
	},
	{
	"epoch": 0.4613951449394487,
	"grad_norm": 1.88534414768219,
	"learning_rate": 0.0001,
	"loss": 0.7828,
	"step": 8420
	},
	{
	"epoch": 0.4624910954024878,
	"grad_norm": 1.7713934183120728,
	"learning_rate": 0.0001,
	"loss": 0.7289,
	"step": 8440
	},
	{
	"epoch": 0.4635870458655269,
	"grad_norm": 1.9173312187194824,
	"learning_rate": 0.0001,
	"loss": 0.7478,
	"step": 8460
	},
	{
	"epoch": 0.46468299632856597,
	"grad_norm": 1.6866717338562012,
	"learning_rate": 0.0001,
	"loss": 0.8235,
	"step": 8480
	},
	{
	"epoch": 0.46577894679160503,
	"grad_norm": 1.6713476181030273,
	"learning_rate": 0.0001,
	"loss": 0.7216,
	"step": 8500
	},
	{
	"epoch": 0.4668748972546441,
	"grad_norm": 1.9601606130599976,
	"learning_rate": 0.0001,
	"loss": 0.6994,
	"step": 8520
	},
	{
	"epoch": 0.46797084771768316,
	"grad_norm": 1.7472949028015137,
	"learning_rate": 0.0001,
	"loss": 0.7694,
	"step": 8540
	},
	{
	"epoch": 0.4690667981807222,
	"grad_norm": 1.8540037870407104,
	"learning_rate": 0.0001,
	"loss": 0.7253,
	"step": 8560
	},
	{
	"epoch": 0.4701627486437613,
	"grad_norm": 2.0671746730804443,
	"learning_rate": 0.0001,
	"loss": 0.7514,
	"step": 8580
	},
	{
	"epoch": 0.47125869910680035,
	"grad_norm": 1.900918960571289,
	"learning_rate": 0.0001,
	"loss": 0.7871,
	"step": 8600
	},
	{
	"epoch": 0.47235464956983947,
	"grad_norm": 1.7465757131576538,
	"learning_rate": 0.0001,
	"loss": 0.8009,
	"step": 8620
	},
	{
	"epoch": 0.47345060003287853,
	"grad_norm": 2.3400652408599854,
	"learning_rate": 0.0001,
	"loss": 0.7741,
	"step": 8640
	},
	{
	"epoch": 0.4745465504959176,
	"grad_norm": 2.1384716033935547,
	"learning_rate": 0.0001,
	"loss": 0.7577,
	"step": 8660
	},
	{
	"epoch": 0.47564250095895666,
	"grad_norm": 2.7113006114959717,
	"learning_rate": 0.0001,
	"loss": 0.6968,
	"step": 8680
	},
	{
	"epoch": 0.4767384514219957,
	"grad_norm": 1.6666728258132935,
	"learning_rate": 0.0001,
	"loss": 0.7307,
	"step": 8700
	},
	{
	"epoch": 0.4778344018850348,
	"grad_norm": 1.8394851684570312,
	"learning_rate": 0.0001,
	"loss": 0.7353,
	"step": 8720
	},
	{
	"epoch": 0.47893035234807385,
	"grad_norm": 2.0569512844085693,
	"learning_rate": 0.0001,
	"loss": 0.814,
	"step": 8740
	},
	{
	"epoch": 0.4800263028111129,
	"grad_norm": 1.6457910537719727,
	"learning_rate": 0.0001,
	"loss": 0.7521,
	"step": 8760
	},
	{
	"epoch": 0.48112225327415203,
	"grad_norm": 2.010711908340454,
	"learning_rate": 0.0001,
	"loss": 0.7101,
	"step": 8780
	},
	{
	"epoch": 0.4822182037371911,
	"grad_norm": 2.422718048095703,
	"learning_rate": 0.0001,
	"loss": 0.7867,
	"step": 8800
	},
	{
	"epoch": 0.48331415420023016,
	"grad_norm": 1.5170652866363525,
	"learning_rate": 0.0001,
	"loss": 0.8042,
	"step": 8820
	},
	{
	"epoch": 0.4844101046632692,
	"grad_norm": 1.9751352071762085,
	"learning_rate": 0.0001,
	"loss": 0.7408,
	"step": 8840
	},
	{
	"epoch": 0.4855060551263083,
	"grad_norm": 1.8477592468261719,
	"learning_rate": 0.0001,
	"loss": 0.7675,
	"step": 8860
	},
	{
	"epoch": 0.48660200558934735,
	"grad_norm": 1.9999114274978638,
	"learning_rate": 0.0001,
	"loss": 0.745,
	"step": 8880
	},
	{
	"epoch": 0.4876979560523864,
	"grad_norm": 1.7456104755401611,
	"learning_rate": 0.0001,
	"loss": 0.7713,
	"step": 8900
	},
	{
	"epoch": 0.4887939065154255,
	"grad_norm": 1.9687026739120483,
	"learning_rate": 0.0001,
	"loss": 0.7349,
	"step": 8920
	},
	{
	"epoch": 0.4898898569784646,
	"grad_norm": 1.8585296869277954,
	"learning_rate": 0.0001,
	"loss": 0.7369,
	"step": 8940
	},
	{
	"epoch": 0.49098580744150366,
	"grad_norm": 2.7875003814697266,
	"learning_rate": 0.0001,
	"loss": 0.7002,
	"step": 8960
	},
	{
	"epoch": 0.4920817579045427,
	"grad_norm": 2.01347017288208,
	"learning_rate": 0.0001,
	"loss": 0.7598,
	"step": 8980
	},
	{
	"epoch": 0.4931777083675818,
	"grad_norm": 1.8863261938095093,
	"learning_rate": 0.0001,
	"loss": 0.7617,
	"step": 9000
	},
	{
	"epoch": 0.4931777083675818,
	"eval_loss": 0.7443549036979675,
	"eval_runtime": 31204.044,
	"eval_samples_per_second": 2.079,
	"eval_steps_per_second": 0.065,
	"eval_wer": 44.168238762227254,
	"step": 9000
	},
	{
	"epoch": 0.49427365883062085,
	"grad_norm": 2.0402464866638184,
	"learning_rate": 0.0001,
	"loss": 0.8118,
	"step": 9020
	},
	{
	"epoch": 0.4953696092936599,
	"grad_norm": 2.072380304336548,
	"learning_rate": 0.0001,
	"loss": 0.6703,
	"step": 9040
	},
	{
	"epoch": 0.496465559756699,
	"grad_norm": 1.9627012014389038,
	"learning_rate": 0.0001,
	"loss": 0.7547,
	"step": 9060
	},
	{
	"epoch": 0.49756151021973805,
	"grad_norm": 1.904860496520996,
	"learning_rate": 0.0001,
	"loss": 0.8141,
	"step": 9080
	},
	{
	"epoch": 0.49865746068277716,
	"grad_norm": 2.153672933578491,
	"learning_rate": 0.0001,
	"loss": 0.8167,
	"step": 9100
	},
	{
	"epoch": 0.49975341114581623,
	"grad_norm": 2.0599303245544434,
	"learning_rate": 0.0001,
	"loss": 0.8632,
	"step": 9120
	},
	{
	"epoch": 0.5008493616088553,
	"grad_norm": 1.9562146663665771,
	"learning_rate": 0.0001,
	"loss": 0.7477,
	"step": 9140
	},
	{
	"epoch": 0.5019453120718943,
	"grad_norm": 2.086508274078369,
	"learning_rate": 0.0001,
	"loss": 0.7973,
	"step": 9160
	},
	{
	"epoch": 0.5030412625349334,
	"grad_norm": 1.9192993640899658,
	"learning_rate": 0.0001,
	"loss": 0.8359,
	"step": 9180
	},
	{
	"epoch": 0.5041372129979725,
	"grad_norm": 1.9085866212844849,
	"learning_rate": 0.0001,
	"loss": 0.7942,
	"step": 9200
	},
	{
	"epoch": 0.5052331634610115,
	"grad_norm": 1.901637315750122,
	"learning_rate": 0.0001,
	"loss": 0.7608,
	"step": 9220
	},
	{
	"epoch": 0.5063291139240507,
	"grad_norm": 2.145914316177368,
	"learning_rate": 0.0001,
	"loss": 0.6919,
	"step": 9240
	},
	{
	"epoch": 0.5074250643870897,
	"grad_norm": 1.9005271196365356,
	"learning_rate": 0.0001,
	"loss": 0.7506,
	"step": 9260
	},
	{
	"epoch": 0.5085210148501288,
	"grad_norm": 1.6468952894210815,
	"learning_rate": 0.0001,
	"loss": 0.7843,
	"step": 9280
	},
	{
	"epoch": 0.5096169653131678,
	"grad_norm": 1.7703279256820679,
	"learning_rate": 0.0001,
	"loss": 0.7192,
	"step": 9300
	},
	{
	"epoch": 0.5107129157762069,
	"grad_norm": 2.0094175338745117,
	"learning_rate": 0.0001,
	"loss": 0.847,
	"step": 9320
	},
	{
	"epoch": 0.511808866239246,
	"grad_norm": 2.0970561504364014,
	"learning_rate": 0.0001,
	"loss": 0.7679,
	"step": 9340
	},
	{
	"epoch": 0.512904816702285,
	"grad_norm": 1.757664680480957,
	"learning_rate": 0.0001,
	"loss": 0.7391,
	"step": 9360
	},
	{
	"epoch": 0.5140007671653242,
	"grad_norm": 1.8297368288040161,
	"learning_rate": 0.0001,
	"loss": 0.8382,
	"step": 9380
	},
	{
	"epoch": 0.5150967176283632,
	"grad_norm": 1.9832725524902344,
	"learning_rate": 0.0001,
	"loss": 0.7226,
	"step": 9400
	},
	{
	"epoch": 0.5161926680914023,
	"grad_norm": 1.7083086967468262,
	"learning_rate": 0.0001,
	"loss": 0.7798,
	"step": 9420
	},
	{
	"epoch": 0.5172886185544413,
	"grad_norm": 1.7105575799942017,
	"learning_rate": 0.0001,
	"loss": 0.7118,
	"step": 9440
	},
	{
	"epoch": 0.5183845690174804,
	"grad_norm": 1.547608494758606,
	"learning_rate": 0.0001,
	"loss": 0.7259,
	"step": 9460
	},
	{
	"epoch": 0.5194805194805194,
	"grad_norm": 2.0215799808502197,
	"learning_rate": 0.0001,
	"loss": 0.7648,
	"step": 9480
	},
	{
	"epoch": 0.5205764699435586,
	"grad_norm": 1.5999863147735596,
	"learning_rate": 0.0001,
	"loss": 0.7863,
	"step": 9500
	},
	{
	"epoch": 0.5216724204065977,
	"grad_norm": 2.0813591480255127,
	"learning_rate": 0.0001,
	"loss": 0.758,
	"step": 9520
	},
	{
	"epoch": 0.5227683708696367,
	"grad_norm": 1.6513686180114746,
	"learning_rate": 0.0001,
	"loss": 0.7735,
	"step": 9540
	},
	{
	"epoch": 0.5238643213326758,
	"grad_norm": 1.49434232711792,
	"learning_rate": 0.0001,
	"loss": 0.6547,
	"step": 9560
	},
	{
	"epoch": 0.5249602717957148,
	"grad_norm": 1.8316184282302856,
	"learning_rate": 0.0001,
	"loss": 0.7428,
	"step": 9580
	},
	{
	"epoch": 0.5260562222587539,
	"grad_norm": 2.0041682720184326,
	"learning_rate": 0.0001,
	"loss": 0.7058,
	"step": 9600
	},
	{
	"epoch": 0.5271521727217929,
	"grad_norm": 1.9916651248931885,
	"learning_rate": 0.0001,
	"loss": 0.7049,
	"step": 9620
	},
	{
	"epoch": 0.528248123184832,
	"grad_norm": 1.8289718627929688,
	"learning_rate": 0.0001,
	"loss": 0.7179,
	"step": 9640
	},
	{
	"epoch": 0.5293440736478712,
	"grad_norm": 1.7447452545166016,
	"learning_rate": 0.0001,
	"loss": 0.7432,
	"step": 9660
	},
	{
	"epoch": 0.5304400241109102,
	"grad_norm": 2.375234365463257,
	"learning_rate": 0.0001,
	"loss": 0.6676,
	"step": 9680
	},
	{
	"epoch": 0.5315359745739493,
	"grad_norm": 1.683435320854187,
	"learning_rate": 0.0001,
	"loss": 0.7269,
	"step": 9700
	},
	{
	"epoch": 0.5326319250369883,
	"grad_norm": 1.6535717248916626,
	"learning_rate": 0.0001,
	"loss": 0.7315,
	"step": 9720
	},
	{
	"epoch": 0.5337278755000274,
	"grad_norm": 1.5276830196380615,
	"learning_rate": 0.0001,
	"loss": 0.7382,
	"step": 9740
	},
	{
	"epoch": 0.5348238259630664,
	"grad_norm": 1.8443965911865234,
	"learning_rate": 0.0001,
	"loss": 0.7471,
	"step": 9760
	},
	{
	"epoch": 0.5359197764261056,
	"grad_norm": 2.0346148014068604,
	"learning_rate": 0.0001,
	"loss": 0.7268,
	"step": 9780
	},
	{
	"epoch": 0.5370157268891446,
	"grad_norm": 1.750613808631897,
	"learning_rate": 0.0001,
	"loss": 0.8444,
	"step": 9800
	},
	{
	"epoch": 0.5381116773521837,
	"grad_norm": 1.9546024799346924,
	"learning_rate": 0.0001,
	"loss": 0.6968,
	"step": 9820
	},
	{
	"epoch": 0.5392076278152228,
	"grad_norm": 1.6618010997772217,
	"learning_rate": 0.0001,
	"loss": 0.7222,
	"step": 9840
	},
	{
	"epoch": 0.5403035782782618,
	"grad_norm": 1.6404950618743896,
	"learning_rate": 0.0001,
	"loss": 0.6896,
	"step": 9860
	},
	{
	"epoch": 0.5413995287413009,
	"grad_norm": 1.7741234302520752,
	"learning_rate": 0.0001,
	"loss": 0.7412,
	"step": 9880
	},
	{
	"epoch": 0.5424954792043399,
	"grad_norm": 1.8278882503509521,
	"learning_rate": 0.0001,
	"loss": 0.7385,
	"step": 9900
	},
	{
	"epoch": 0.5435914296673791,
	"grad_norm": 1.6102566719055176,
	"learning_rate": 0.0001,
	"loss": 0.7461,
	"step": 9920
	},
	{
	"epoch": 0.5446873801304181,
	"grad_norm": 1.7899205684661865,
	"learning_rate": 0.0001,
	"loss": 0.6349,
	"step": 9940
	},
	{
	"epoch": 0.5457833305934572,
	"grad_norm": 1.9663938283920288,
	"learning_rate": 0.0001,
	"loss": 0.8028,
	"step": 9960
	},
	{
	"epoch": 0.5468792810564962,
	"grad_norm": 1.841476559638977,
	"learning_rate": 0.0001,
	"loss": 0.7503,
	"step": 9980
	},
	{
	"epoch": 0.5479752315195353,
	"grad_norm": 1.9106056690216064,
	"learning_rate": 0.0001,
	"loss": 0.7097,
	"step": 10000
	},
	{
	"epoch": 0.5479752315195353,
	"eval_loss": 0.7265371084213257,
	"eval_runtime": 30536.1813,
	"eval_samples_per_second": 2.125,
	"eval_steps_per_second": 0.066,
	"eval_wer": 42.517110448415295,
	"step": 10000
	},
	{
	"epoch": 0.5490711819825744,
	"grad_norm": 1.680649995803833,
	"learning_rate": 0.0001,
	"loss": 0.6445,
	"step": 10020
	},
	{
	"epoch": 0.5501671324456134,
	"grad_norm": 2.079050064086914,
	"learning_rate": 0.0001,
	"loss": 0.7648,
	"step": 10040
	},
	{
	"epoch": 0.5512630829086526,
	"grad_norm": 1.4419294595718384,
	"learning_rate": 0.0001,
	"loss": 0.6953,
	"step": 10060
	},
	{
	"epoch": 0.5523590333716916,
	"grad_norm": 1.9906927347183228,
	"learning_rate": 0.0001,
	"loss": 0.749,
	"step": 10080
	},
	{
	"epoch": 0.5534549838347307,
	"grad_norm": 1.7384852170944214,
	"learning_rate": 0.0001,
	"loss": 0.745,
	"step": 10100
	},
	{
	"epoch": 0.5545509342977697,
	"grad_norm": 1.7342479228973389,
	"learning_rate": 0.0001,
	"loss": 0.7687,
	"step": 10120
	},
	{
	"epoch": 0.5556468847608088,
	"grad_norm": 1.887969970703125,
	"learning_rate": 0.0001,
	"loss": 0.7662,
	"step": 10140
	},
	{
	"epoch": 0.5567428352238479,
	"grad_norm": 1.6345020532608032,
	"learning_rate": 0.0001,
	"loss": 0.7843,
	"step": 10160
	},
	{
	"epoch": 0.5578387856868869,
	"grad_norm": 1.5596251487731934,
	"learning_rate": 0.0001,
	"loss": 0.6983,
	"step": 10180
	},
	{
	"epoch": 0.5589347361499261,
	"grad_norm": 1.6423192024230957,
	"learning_rate": 0.0001,
	"loss": 0.6622,
	"step": 10200
	},
	{
	"epoch": 0.5600306866129651,
	"grad_norm": 1.7268792390823364,
	"learning_rate": 0.0001,
	"loss": 0.8409,
	"step": 10220
	},
	{
	"epoch": 0.5611266370760042,
	"grad_norm": 1.6870604753494263,
	"learning_rate": 0.0001,
	"loss": 0.7801,
	"step": 10240
	},
	{
	"epoch": 0.5622225875390432,
	"grad_norm": 1.5945113897323608,
	"learning_rate": 0.0001,
	"loss": 0.6695,
	"step": 10260
	},
	{
	"epoch": 0.5633185380020823,
	"grad_norm": 1.7995914220809937,
	"learning_rate": 0.0001,
	"loss": 0.7088,
	"step": 10280
	},
	{
	"epoch": 0.5644144884651213,
	"grad_norm": 1.8924362659454346,
	"learning_rate": 0.0001,
	"loss": 0.7621,
	"step": 10300
	},
	{
	"epoch": 0.5655104389281604,
	"grad_norm": 1.5099490880966187,
	"learning_rate": 0.0001,
	"loss": 0.6923,
	"step": 10320
	},
	{
	"epoch": 0.5666063893911996,
	"grad_norm": 1.481195092201233,
	"learning_rate": 0.0001,
	"loss": 0.6801,
	"step": 10340
	},
	{
	"epoch": 0.5677023398542386,
	"grad_norm": 1.9247808456420898,
	"learning_rate": 0.0001,
	"loss": 0.7247,
	"step": 10360
	},
	{
	"epoch": 0.5687982903172777,
	"grad_norm": 1.721666693687439,
	"learning_rate": 0.0001,
	"loss": 0.85,
	"step": 10380
	},
	{
	"epoch": 0.5698942407803167,
	"grad_norm": 1.981312870979309,
	"learning_rate": 0.0001,
	"loss": 0.6894,
	"step": 10400
	},
	{
	"epoch": 0.5709901912433558,
	"grad_norm": 1.825363039970398,
	"learning_rate": 0.0001,
	"loss": 0.7017,
	"step": 10420
	},
	{
	"epoch": 0.5720861417063948,
	"grad_norm": 2.021385669708252,
	"learning_rate": 0.0001,
	"loss": 0.7996,
	"step": 10440
	},
	{
	"epoch": 0.5731820921694339,
	"grad_norm": 1.9287372827529907,
	"learning_rate": 0.0001,
	"loss": 0.7387,
	"step": 10460
	},
	{
	"epoch": 0.5742780426324731,
	"grad_norm": 2.0109355449676514,
	"learning_rate": 0.0001,
	"loss": 0.7359,
	"step": 10480
	},
	{
	"epoch": 0.5753739930955121,
	"grad_norm": 1.7715758085250854,
	"learning_rate": 0.0001,
	"loss": 0.7126,
	"step": 10500
	},
	{
	"epoch": 0.5764699435585512,
	"grad_norm": 1.5866303443908691,
	"learning_rate": 0.0001,
	"loss": 0.6808,
	"step": 10520
	},
	{
	"epoch": 0.5775658940215902,
	"grad_norm": 1.3831912279129028,
	"learning_rate": 0.0001,
	"loss": 0.7251,
	"step": 10540
	},
	{
	"epoch": 0.5786618444846293,
	"grad_norm": 1.603388786315918,
	"learning_rate": 0.0001,
	"loss": 0.6497,
	"step": 10560
	},
	{
	"epoch": 0.5797577949476683,
	"grad_norm": 1.8507051467895508,
	"learning_rate": 0.0001,
	"loss": 0.7247,
	"step": 10580
	},
	{
	"epoch": 0.5808537454107074,
	"grad_norm": 2.240337610244751,
	"learning_rate": 0.0001,
	"loss": 0.7879,
	"step": 10600
	},
	{
	"epoch": 0.5819496958737465,
	"grad_norm": 1.858344316482544,
	"learning_rate": 0.0001,
	"loss": 0.647,
	"step": 10620
	},
	{
	"epoch": 0.5830456463367856,
	"grad_norm": 1.840640664100647,
	"learning_rate": 0.0001,
	"loss": 0.6924,
	"step": 10640
	},
	{
	"epoch": 0.5841415967998247,
	"grad_norm": 2.0423295497894287,
	"learning_rate": 0.0001,
	"loss": 0.6762,
	"step": 10660
	},
	{
	"epoch": 0.5852375472628637,
	"grad_norm": 1.7426679134368896,
	"learning_rate": 0.0001,
	"loss": 0.7824,
	"step": 10680
	},
	{
	"epoch": 0.5863334977259028,
	"grad_norm": 1.5974029302597046,
	"learning_rate": 0.0001,
	"loss": 0.6874,
	"step": 10700
	},
	{
	"epoch": 0.5874294481889418,
	"grad_norm": 1.6082810163497925,
	"learning_rate": 0.0001,
	"loss": 0.6916,
	"step": 10720
	},
	{
	"epoch": 0.588525398651981,
	"grad_norm": 1.6124242544174194,
	"learning_rate": 0.0001,
	"loss": 0.676,
	"step": 10740
	},
	{
	"epoch": 0.58962134911502,
	"grad_norm": 1.9140983819961548,
	"learning_rate": 0.0001,
	"loss": 0.6281,
	"step": 10760
	},
	{
	"epoch": 0.5907172995780591,
	"grad_norm": 1.708742618560791,
	"learning_rate": 0.0001,
	"loss": 0.7245,
	"step": 10780
	},
	{
	"epoch": 0.5918132500410982,
	"grad_norm": 2.36368989944458,
	"learning_rate": 0.0001,
	"loss": 0.6934,
	"step": 10800
	},
	{
	"epoch": 0.5929092005041372,
	"grad_norm": 1.9806820154190063,
	"learning_rate": 0.0001,
	"loss": 0.677,
	"step": 10820
	},
	{
	"epoch": 0.5940051509671763,
	"grad_norm": 1.893801212310791,
	"learning_rate": 0.0001,
	"loss": 0.7629,
	"step": 10840
	},
	{
	"epoch": 0.5951011014302153,
	"grad_norm": 1.917204737663269,
	"learning_rate": 0.0001,
	"loss": 0.7836,
	"step": 10860
	},
	{
	"epoch": 0.5961970518932544,
	"grad_norm": 1.5599673986434937,
	"learning_rate": 0.0001,
	"loss": 0.7132,
	"step": 10880
	},
	{
	"epoch": 0.5972930023562935,
	"grad_norm": 1.9569772481918335,
	"learning_rate": 0.0001,
	"loss": 0.7466,
	"step": 10900
	},
	{
	"epoch": 0.5983889528193326,
	"grad_norm": 1.8709198236465454,
	"learning_rate": 0.0001,
	"loss": 0.6456,
	"step": 10920
	},
	{
	"epoch": 0.5994849032823716,
	"grad_norm": 1.8249480724334717,
	"learning_rate": 0.0001,
	"loss": 0.7159,
	"step": 10940
	},
	{
	"epoch": 0.6005808537454107,
	"grad_norm": 1.7063779830932617,
	"learning_rate": 0.0001,
	"loss": 0.7093,
	"step": 10960
	},
	{
	"epoch": 0.6016768042084498,
	"grad_norm": 1.681219220161438,
	"learning_rate": 0.0001,
	"loss": 0.6995,
	"step": 10980
	},
	{
	"epoch": 0.6027727546714888,
	"grad_norm": 1.640663504600525,
	"learning_rate": 0.0001,
	"loss": 0.7045,
	"step": 11000
	},
	{
	"epoch": 0.6027727546714888,
	"eval_loss": 0.7112395763397217,
	"eval_runtime": 30901.8839,
	"eval_samples_per_second": 2.1,
	"eval_steps_per_second": 0.066,
	"eval_wer": 47.33354332649714,
	"step": 11000
	},
	{
	"epoch": 0.603868705134528,
	"grad_norm": 1.7204805612564087,
	"learning_rate": 0.0001,
	"loss": 0.7217,
	"step": 11020
	},
	{
	"epoch": 0.604964655597567,
	"grad_norm": 1.507012128829956,
	"learning_rate": 0.0001,
	"loss": 0.7482,
	"step": 11040
	},
	{
	"epoch": 0.6060606060606061,
	"grad_norm": 1.7084465026855469,
	"learning_rate": 0.0001,
	"loss": 0.645,
	"step": 11060
	},
	{
	"epoch": 0.6071565565236451,
	"grad_norm": 1.73207426071167,
	"learning_rate": 0.0001,
	"loss": 0.7687,
	"step": 11080
	},
	{
	"epoch": 0.6082525069866842,
	"grad_norm": 2.2146365642547607,
	"learning_rate": 0.0001,
	"loss": 0.7771,
	"step": 11100
	},
	{
	"epoch": 0.6093484574497233,
	"grad_norm": 1.6794184446334839,
	"learning_rate": 0.0001,
	"loss": 0.6613,
	"step": 11120
	},
	{
	"epoch": 0.6104444079127623,
	"grad_norm": 1.8254398107528687,
	"learning_rate": 0.0001,
	"loss": 0.6787,
	"step": 11140
	},
	{
	"epoch": 0.6115403583758015,
	"grad_norm": 1.8397271633148193,
	"learning_rate": 0.0001,
	"loss": 0.7119,
	"step": 11160
	},
	{
	"epoch": 0.6126363088388405,
	"grad_norm": 1.8676248788833618,
	"learning_rate": 0.0001,
	"loss": 0.7294,
	"step": 11180
	},
	{
	"epoch": 0.6137322593018796,
	"grad_norm": 1.4971026182174683,
	"learning_rate": 0.0001,
	"loss": 0.6312,
	"step": 11200
	},
	{
	"epoch": 0.6148282097649186,
	"grad_norm": 1.8128615617752075,
	"learning_rate": 0.0001,
	"loss": 0.653,
	"step": 11220
	},
	{
	"epoch": 0.6159241602279577,
	"grad_norm": 1.426620364189148,
	"learning_rate": 0.0001,
	"loss": 0.7087,
	"step": 11240
	},
	{
	"epoch": 0.6170201106909967,
	"grad_norm": 1.4840887784957886,
	"learning_rate": 0.0001,
	"loss": 0.6665,
	"step": 11260
	},
	{
	"epoch": 0.6181160611540358,
	"grad_norm": 1.7882121801376343,
	"learning_rate": 0.0001,
	"loss": 0.7236,
	"step": 11280
	},
	{
	"epoch": 0.619212011617075,
	"grad_norm": 1.8195546865463257,
	"learning_rate": 0.0001,
	"loss": 0.7998,
	"step": 11300
	},
	{
	"epoch": 0.620307962080114,
	"grad_norm": 1.9482252597808838,
	"learning_rate": 0.0001,
	"loss": 0.751,
	"step": 11320
	},
	{
	"epoch": 0.6214039125431531,
	"grad_norm": 2.1224782466888428,
	"learning_rate": 0.0001,
	"loss": 0.7518,
	"step": 11340
	},
	{
	"epoch": 0.6224998630061921,
	"grad_norm": 1.811909556388855,
	"learning_rate": 0.0001,
	"loss": 0.679,
	"step": 11360
	},
	{
	"epoch": 0.6235958134692312,
	"grad_norm": 2.0843353271484375,
	"learning_rate": 0.0001,
	"loss": 0.7381,
	"step": 11380
	},
	{
	"epoch": 0.6246917639322702,
	"grad_norm": 1.5517933368682861,
	"learning_rate": 0.0001,
	"loss": 0.7318,
	"step": 11400
	},
	{
	"epoch": 0.6257877143953093,
	"grad_norm": 1.3482716083526611,
	"learning_rate": 0.0001,
	"loss": 0.6999,
	"step": 11420
	},
	{
	"epoch": 0.6268836648583485,
	"grad_norm": 1.548904299736023,
	"learning_rate": 0.0001,
	"loss": 0.8772,
	"step": 11440
	},
	{
	"epoch": 0.6279796153213875,
	"grad_norm": 1.553775429725647,
	"learning_rate": 0.0001,
	"loss": 0.6479,
	"step": 11460
	},
	{
	"epoch": 0.6290755657844266,
	"grad_norm": 2.0762696266174316,
	"learning_rate": 0.0001,
	"loss": 0.6457,
	"step": 11480
	},
	{
	"epoch": 0.6301715162474656,
	"grad_norm": 1.9620105028152466,
	"learning_rate": 0.0001,
	"loss": 0.7098,
	"step": 11500
	},
	{
	"epoch": 0.6312674667105047,
	"grad_norm": 1.382176399230957,
	"learning_rate": 0.0001,
	"loss": 0.686,
	"step": 11520
	},
	{
	"epoch": 0.6323634171735437,
	"grad_norm": 1.9390108585357666,
	"learning_rate": 0.0001,
	"loss": 0.6882,
	"step": 11540
	},
	{
	"epoch": 0.6334593676365828,
	"grad_norm": 1.7750768661499023,
	"learning_rate": 0.0001,
	"loss": 0.6942,
	"step": 11560
	},
	{
	"epoch": 0.6345553180996218,
	"grad_norm": 1.8459293842315674,
	"learning_rate": 0.0001,
	"loss": 0.7118,
	"step": 11580
	},
	{
	"epoch": 0.635651268562661,
	"grad_norm": 1.8210084438323975,
	"learning_rate": 0.0001,
	"loss": 0.7166,
	"step": 11600
	},
	{
	"epoch": 0.6367472190257001,
	"grad_norm": 1.7728508710861206,
	"learning_rate": 0.0001,
	"loss": 0.692,
	"step": 11620
	},
	{
	"epoch": 0.6378431694887391,
	"grad_norm": 1.7886627912521362,
	"learning_rate": 0.0001,
	"loss": 0.7185,
	"step": 11640
	},
	{
	"epoch": 0.6389391199517782,
	"grad_norm": 1.895150065422058,
	"learning_rate": 0.0001,
	"loss": 0.7174,
	"step": 11660
	},
	{
	"epoch": 0.6400350704148172,
	"grad_norm": 1.8740530014038086,
	"learning_rate": 0.0001,
	"loss": 0.6893,
	"step": 11680
	},
	{
	"epoch": 0.6411310208778563,
	"grad_norm": 1.6588834524154663,
	"learning_rate": 0.0001,
	"loss": 0.7073,
	"step": 11700
	},
	{
	"epoch": 0.6422269713408953,
	"grad_norm": 1.9573453664779663,
	"learning_rate": 0.0001,
	"loss": 0.671,
	"step": 11720
	},
	{
	"epoch": 0.6433229218039345,
	"grad_norm": 1.7064661979675293,
	"learning_rate": 0.0001,
	"loss": 0.7401,
	"step": 11740
	},
	{
	"epoch": 0.6444188722669736,
	"grad_norm": 1.8850706815719604,
	"learning_rate": 0.0001,
	"loss": 0.7397,
	"step": 11760
	},
	{
	"epoch": 0.6455148227300126,
	"grad_norm": 1.7744836807250977,
	"learning_rate": 0.0001,
	"loss": 0.7204,
	"step": 11780
	},
	{
	"epoch": 0.6466107731930517,
	"grad_norm": 1.5768756866455078,
	"learning_rate": 0.0001,
	"loss": 0.7868,
	"step": 11800
	},
	{
	"epoch": 0.6477067236560907,
	"grad_norm": 2.0770552158355713,
	"learning_rate": 0.0001,
	"loss": 0.7434,
	"step": 11820
	},
	{
	"epoch": 0.6488026741191298,
	"grad_norm": 2.0797810554504395,
	"learning_rate": 0.0001,
	"loss": 0.7342,
	"step": 11840
	},
	{
	"epoch": 0.6498986245821688,
	"grad_norm": 1.8984261751174927,
	"learning_rate": 0.0001,
	"loss": 0.6642,
	"step": 11860
	},
	{
	"epoch": 0.650994575045208,
	"grad_norm": 2.00124192237854,
	"learning_rate": 0.0001,
	"loss": 0.749,
	"step": 11880
	},
	{
	"epoch": 0.652090525508247,
	"grad_norm": 1.5575506687164307,
	"learning_rate": 0.0001,
	"loss": 0.8315,
	"step": 11900
	},
	{
	"epoch": 0.6531864759712861,
	"grad_norm": 2.6183197498321533,
	"learning_rate": 0.0001,
	"loss": 0.7533,
	"step": 11920
	},
	{
	"epoch": 0.6542824264343252,
	"grad_norm": 1.7211464643478394,
	"learning_rate": 0.0001,
	"loss": 0.7073,
	"step": 11940
	},
	{
	"epoch": 0.6553783768973642,
	"grad_norm": 1.9105095863342285,
	"learning_rate": 0.0001,
	"loss": 0.6526,
	"step": 11960
	},
	{
	"epoch": 0.6564743273604033,
	"grad_norm": 1.9578741788864136,
	"learning_rate": 0.0001,
	"loss": 0.6746,
	"step": 11980
	},
	{
	"epoch": 0.6575702778234424,
	"grad_norm": 1.8473331928253174,
	"learning_rate": 0.0001,
	"loss": 0.6808,
	"step": 12000
	},
	{
	"epoch": 0.6575702778234424,
	"eval_loss": 0.6952778100967407,
	"eval_runtime": 30743.2328,
	"eval_samples_per_second": 2.111,
	"eval_steps_per_second": 0.066,
	"eval_wer": 51.05538683822195,
	"step": 12000
	},
	{
	"epoch": 0.6586662282864815,
	"grad_norm": 1.7486096620559692,
	"learning_rate": 0.0001,
	"loss": 0.7417,
	"step": 12020
	},
	{
	"epoch": 0.6597621787495205,
	"grad_norm": 1.6540303230285645,
	"learning_rate": 0.0001,
	"loss": 0.7118,
	"step": 12040
	},
	{
	"epoch": 0.6608581292125596,
	"grad_norm": 1.89935302734375,
	"learning_rate": 0.0001,
	"loss": 0.6315,
	"step": 12060
	},
	{
	"epoch": 0.6619540796755987,
	"grad_norm": 1.8266342878341675,
	"learning_rate": 0.0001,
	"loss": 0.7434,
	"step": 12080
	},
	{
	"epoch": 0.6630500301386377,
	"grad_norm": 1.8254984617233276,
	"learning_rate": 0.0001,
	"loss": 0.7832,
	"step": 12100
	},
	{
	"epoch": 0.6641459806016768,
	"grad_norm": 2.0791878700256348,
	"learning_rate": 0.0001,
	"loss": 0.6694,
	"step": 12120
	},
	{
	"epoch": 0.6652419310647159,
	"grad_norm": 1.8277227878570557,
	"learning_rate": 0.0001,
	"loss": 0.6686,
	"step": 12140
	},
	{
	"epoch": 0.666337881527755,
	"grad_norm": 1.697810411453247,
	"learning_rate": 0.0001,
	"loss": 0.6895,
	"step": 12160
	},
	{
	"epoch": 0.667433831990794,
	"grad_norm": 1.6084686517715454,
	"learning_rate": 0.0001,
	"loss": 0.7431,
	"step": 12180
	},
	{
	"epoch": 0.6685297824538331,
	"grad_norm": 1.7437437772750854,
	"learning_rate": 0.0001,
	"loss": 0.6851,
	"step": 12200
	},
	{
	"epoch": 0.6696257329168721,
	"grad_norm": 1.849237322807312,
	"learning_rate": 0.0001,
	"loss": 0.6926,
	"step": 12220
	},
	{
	"epoch": 0.6707216833799112,
	"grad_norm": 1.8398326635360718,
	"learning_rate": 0.0001,
	"loss": 0.7282,
	"step": 12240
	},
	{
	"epoch": 0.6718176338429503,
	"grad_norm": 2.056136131286621,
	"learning_rate": 0.0001,
	"loss": 0.76,
	"step": 12260
	},
	{
	"epoch": 0.6729135843059894,
	"grad_norm": 1.8255378007888794,
	"learning_rate": 0.0001,
	"loss": 0.7155,
	"step": 12280
	},
	{
	"epoch": 0.6740095347690285,
	"grad_norm": 1.6555898189544678,
	"learning_rate": 0.0001,
	"loss": 0.6333,
	"step": 12300
	},
	{
	"epoch": 0.6751054852320675,
	"grad_norm": 1.825000286102295,
	"learning_rate": 0.0001,
	"loss": 0.6603,
	"step": 12320
	},
	{
	"epoch": 0.6762014356951066,
	"grad_norm": 1.5000559091567993,
	"learning_rate": 0.0001,
	"loss": 0.6861,
	"step": 12340
	},
	{
	"epoch": 0.6772973861581456,
	"grad_norm": 1.826874017715454,
	"learning_rate": 0.0001,
	"loss": 0.7337,
	"step": 12360
	},
	{
	"epoch": 0.6783933366211847,
	"grad_norm": 2.042325735092163,
	"learning_rate": 0.0001,
	"loss": 0.7566,
	"step": 12380
	},
	{
	"epoch": 0.6794892870842238,
	"grad_norm": 1.6419124603271484,
	"learning_rate": 0.0001,
	"loss": 0.6825,
	"step": 12400
	},
	{
	"epoch": 0.6805852375472629,
	"grad_norm": 2.1221911907196045,
	"learning_rate": 0.0001,
	"loss": 0.7013,
	"step": 12420
	},
	{
	"epoch": 0.681681188010302,
	"grad_norm": 1.598191738128662,
	"learning_rate": 0.0001,
	"loss": 0.6976,
	"step": 12440
	},
	{
	"epoch": 0.682777138473341,
	"grad_norm": 1.8890109062194824,
	"learning_rate": 0.0001,
	"loss": 0.6792,
	"step": 12460
	},
	{
	"epoch": 0.6838730889363801,
	"grad_norm": 1.7647831439971924,
	"learning_rate": 0.0001,
	"loss": 0.6878,
	"step": 12480
	},
	{
	"epoch": 0.6849690393994191,
	"grad_norm": 1.358193278312683,
	"learning_rate": 0.0001,
	"loss": 0.754,
	"step": 12500
	},
	{
	"epoch": 0.6860649898624582,
	"grad_norm": 1.9739768505096436,
	"learning_rate": 0.0001,
	"loss": 0.6799,
	"step": 12520
	},
	{
	"epoch": 0.6871609403254972,
	"grad_norm": 1.532867670059204,
	"learning_rate": 0.0001,
	"loss": 0.7063,
	"step": 12540
	},
	{
	"epoch": 0.6882568907885364,
	"grad_norm": 1.3203604221343994,
	"learning_rate": 0.0001,
	"loss": 0.6725,
	"step": 12560
	},
	{
	"epoch": 0.6893528412515755,
	"grad_norm": 1.835530161857605,
	"learning_rate": 0.0001,
	"loss": 0.6447,
	"step": 12580
	},
	{
	"epoch": 0.6904487917146145,
	"grad_norm": 1.4508098363876343,
	"learning_rate": 0.0001,
	"loss": 0.7137,
	"step": 12600
	},
	{
	"epoch": 0.6915447421776536,
	"grad_norm": 1.520942211151123,
	"learning_rate": 0.0001,
	"loss": 0.6454,
	"step": 12620
	},
	{
	"epoch": 0.6926406926406926,
	"grad_norm": 1.655716061592102,
	"learning_rate": 0.0001,
	"loss": 0.6659,
	"step": 12640
	},
	{
	"epoch": 0.6937366431037317,
	"grad_norm": 1.5934149026870728,
	"learning_rate": 0.0001,
	"loss": 0.7084,
	"step": 12660
	},
	{
	"epoch": 0.6948325935667707,
	"grad_norm": 1.961393117904663,
	"learning_rate": 0.0001,
	"loss": 0.7553,
	"step": 12680
	},
	{
	"epoch": 0.6959285440298099,
	"grad_norm": 1.4186025857925415,
	"learning_rate": 0.0001,
	"loss": 0.7205,
	"step": 12700
	},
	{
	"epoch": 0.697024494492849,
	"grad_norm": 1.6756350994110107,
	"learning_rate": 0.0001,
	"loss": 0.6166,
	"step": 12720
	},
	{
	"epoch": 0.698120444955888,
	"grad_norm": 1.8438879251480103,
	"learning_rate": 0.0001,
	"loss": 0.6837,
	"step": 12740
	},
	{
	"epoch": 0.6992163954189271,
	"grad_norm": 1.5732409954071045,
	"learning_rate": 0.0001,
	"loss": 0.7777,
	"step": 12760
	},
	{
	"epoch": 0.7003123458819661,
	"grad_norm": 1.8927737474441528,
	"learning_rate": 0.0001,
	"loss": 0.6978,
	"step": 12780
	},
	{
	"epoch": 0.7014082963450052,
	"grad_norm": 1.4720592498779297,
	"learning_rate": 0.0001,
	"loss": 0.7043,
	"step": 12800
	},
	{
	"epoch": 0.7025042468080442,
	"grad_norm": 1.8671678304672241,
	"learning_rate": 0.0001,
	"loss": 0.7245,
	"step": 12820
	},
	{
	"epoch": 0.7036001972710834,
	"grad_norm": 1.5541017055511475,
	"learning_rate": 0.0001,
	"loss": 0.728,
	"step": 12840
	},
	{
	"epoch": 0.7046961477341224,
	"grad_norm": 1.6623157262802124,
	"learning_rate": 0.0001,
	"loss": 0.7211,
	"step": 12860
	},
	{
	"epoch": 0.7057920981971615,
	"grad_norm": 2.1644530296325684,
	"learning_rate": 0.0001,
	"loss": 0.7958,
	"step": 12880
	},
	{
	"epoch": 0.7068880486602006,
	"grad_norm": 1.4526203870773315,
	"learning_rate": 0.0001,
	"loss": 0.6385,
	"step": 12900
	},
	{
	"epoch": 0.7079839991232396,
	"grad_norm": 1.586296796798706,
	"learning_rate": 0.0001,
	"loss": 0.7759,
	"step": 12920
	},
	{
	"epoch": 0.7090799495862787,
	"grad_norm": 1.8547158241271973,
	"learning_rate": 0.0001,
	"loss": 0.7478,
	"step": 12940
	},
	{
	"epoch": 0.7101759000493177,
	"grad_norm": 1.46295964717865,
	"learning_rate": 0.0001,
	"loss": 0.5804,
	"step": 12960
	},
	{
	"epoch": 0.7112718505123569,
	"grad_norm": 1.8653600215911865,
	"learning_rate": 0.0001,
	"loss": 0.6874,
	"step": 12980
	},
	{
	"epoch": 0.7123678009753959,
	"grad_norm": 1.8301453590393066,
	"learning_rate": 0.0001,
	"loss": 0.6886,
	"step": 13000
	},
	{
	"epoch": 0.7123678009753959,
	"eval_loss": 0.6790329217910767,
	"eval_runtime": 30731.9197,
	"eval_samples_per_second": 2.111,
	"eval_steps_per_second": 0.066,
	"eval_wer": 52.619379401724906,
	"step": 13000
	},
	{
	"epoch": 0.713463751438435,
	"grad_norm": 2.6560330390930176,
	"learning_rate": 0.0001,
	"loss": 0.6422,
	"step": 13020
	},
	{
	"epoch": 0.714559701901474,
	"grad_norm": 1.9559868574142456,
	"learning_rate": 0.0001,
	"loss": 0.7321,
	"step": 13040
	},
	{
	"epoch": 0.7156556523645131,
	"grad_norm": 1.8091590404510498,
	"learning_rate": 0.0001,
	"loss": 0.6303,
	"step": 13060
	},
	{
	"epoch": 0.7167516028275522,
	"grad_norm": 1.428688406944275,
	"learning_rate": 0.0001,
	"loss": 0.6489,
	"step": 13080
	},
	{
	"epoch": 0.7178475532905912,
	"grad_norm": 1.6543529033660889,
	"learning_rate": 0.0001,
	"loss": 0.6793,
	"step": 13100
	},
	{
	"epoch": 0.7189435037536304,
	"grad_norm": 2.012596368789673,
	"learning_rate": 0.0001,
	"loss": 0.6502,
	"step": 13120
	},
	{
	"epoch": 0.7200394542166694,
	"grad_norm": 2.0701732635498047,
	"learning_rate": 0.0001,
	"loss": 0.6746,
	"step": 13140
	},
	{
	"epoch": 0.7211354046797085,
	"grad_norm": 1.5318336486816406,
	"learning_rate": 0.0001,
	"loss": 0.6142,
	"step": 13160
	},
	{
	"epoch": 0.7222313551427475,
	"grad_norm": 1.7924253940582275,
	"learning_rate": 0.0001,
	"loss": 0.6536,
	"step": 13180
	},
	{
	"epoch": 0.7233273056057866,
	"grad_norm": 1.8197805881500244,
	"learning_rate": 0.0001,
	"loss": 0.7804,
	"step": 13200
	},
	{
	"epoch": 0.7244232560688257,
	"grad_norm": 1.5444835424423218,
	"learning_rate": 0.0001,
	"loss": 0.6019,
	"step": 13220
	},
	{
	"epoch": 0.7255192065318647,
	"grad_norm": 1.735474705696106,
	"learning_rate": 0.0001,
	"loss": 0.5891,
	"step": 13240
	},
	{
	"epoch": 0.7266151569949039,
	"grad_norm": 1.9891881942749023,
	"learning_rate": 0.0001,
	"loss": 0.6498,
	"step": 13260
	},
	{
	"epoch": 0.7277111074579429,
	"grad_norm": 1.6917784214019775,
	"learning_rate": 0.0001,
	"loss": 0.7044,
	"step": 13280
	},
	{
	"epoch": 0.728807057920982,
	"grad_norm": 1.661033034324646,
	"learning_rate": 0.0001,
	"loss": 0.6185,
	"step": 13300
	},
	{
	"epoch": 0.729903008384021,
	"grad_norm": 2.326937198638916,
	"learning_rate": 0.0001,
	"loss": 0.7274,
	"step": 13320
	},
	{
	"epoch": 0.7309989588470601,
	"grad_norm": 1.6929740905761719,
	"learning_rate": 0.0001,
	"loss": 0.6452,
	"step": 13340
	},
	{
	"epoch": 0.7320949093100991,
	"grad_norm": 1.7399369478225708,
	"learning_rate": 0.0001,
	"loss": 0.6243,
	"step": 13360
	},
	{
	"epoch": 0.7331908597731382,
	"grad_norm": 1.7071975469589233,
	"learning_rate": 0.0001,
	"loss": 0.6578,
	"step": 13380
	},
	{
	"epoch": 0.7342868102361774,
	"grad_norm": 1.7368084192276,
	"learning_rate": 0.0001,
	"loss": 0.6337,
	"step": 13400
	},
	{
	"epoch": 0.7353827606992164,
	"grad_norm": 2.0973663330078125,
	"learning_rate": 0.0001,
	"loss": 0.7101,
	"step": 13420
	},
	{
	"epoch": 0.7364787111622555,
	"grad_norm": 1.636421799659729,
	"learning_rate": 0.0001,
	"loss": 0.6958,
	"step": 13440
	},
	{
	"epoch": 0.7375746616252945,
	"grad_norm": 1.6134982109069824,
	"learning_rate": 0.0001,
	"loss": 0.7336,
	"step": 13460
	},
	{
	"epoch": 0.7386706120883336,
	"grad_norm": 1.8911906480789185,
	"learning_rate": 0.0001,
	"loss": 0.6723,
	"step": 13480
	},
	{
	"epoch": 0.7397665625513726,
	"grad_norm": 1.8372421264648438,
	"learning_rate": 0.0001,
	"loss": 0.6748,
	"step": 13500
	},
	{
	"epoch": 0.7408625130144117,
	"grad_norm": 1.8735203742980957,
	"learning_rate": 0.0001,
	"loss": 0.7481,
	"step": 13520
	},
	{
	"epoch": 0.7419584634774509,
	"grad_norm": 1.7684818506240845,
	"learning_rate": 0.0001,
	"loss": 0.6395,
	"step": 13540
	},
	{
	"epoch": 0.7430544139404899,
	"grad_norm": 1.8018254041671753,
	"learning_rate": 0.0001,
	"loss": 0.8523,
	"step": 13560
	},
	{
	"epoch": 0.744150364403529,
	"grad_norm": 1.7703465223312378,
	"learning_rate": 0.0001,
	"loss": 0.6938,
	"step": 13580
	},
	{
	"epoch": 0.745246314866568,
	"grad_norm": 1.6299625635147095,
	"learning_rate": 0.0001,
	"loss": 0.6341,
	"step": 13600
	},
	{
	"epoch": 0.7463422653296071,
	"grad_norm": 2.0545101165771484,
	"learning_rate": 0.0001,
	"loss": 0.7248,
	"step": 13620
	},
	{
	"epoch": 0.7474382157926461,
	"grad_norm": 1.5883153676986694,
	"learning_rate": 0.0001,
	"loss": 0.6917,
	"step": 13640
	},
	{
	"epoch": 0.7485341662556853,
	"grad_norm": 1.5751030445098877,
	"learning_rate": 0.0001,
	"loss": 0.6789,
	"step": 13660
	},
	{
	"epoch": 0.7496301167187243,
	"grad_norm": 1.53587806224823,
	"learning_rate": 0.0001,
	"loss": 0.6462,
	"step": 13680
	},
	{
	"epoch": 0.7507260671817634,
	"grad_norm": 1.5108363628387451,
	"learning_rate": 0.0001,
	"loss": 0.7585,
	"step": 13700
	},
	{
	"epoch": 0.7518220176448025,
	"grad_norm": 1.5622588396072388,
	"learning_rate": 0.0001,
	"loss": 0.6466,
	"step": 13720
	},
	{
	"epoch": 0.7529179681078415,
	"grad_norm": 1.9326175451278687,
	"learning_rate": 0.0001,
	"loss": 0.7086,
	"step": 13740
	},
	{
	"epoch": 0.7540139185708806,
	"grad_norm": 1.7847191095352173,
	"learning_rate": 0.0001,
	"loss": 0.661,
	"step": 13760
	},
	{
	"epoch": 0.7551098690339196,
	"grad_norm": 2.1520116329193115,
	"learning_rate": 0.0001,
	"loss": 0.5861,
	"step": 13780
	},
	{
	"epoch": 0.7562058194969588,
	"grad_norm": 1.9346301555633545,
	"learning_rate": 0.0001,
	"loss": 0.7735,
	"step": 13800
	},
	{
	"epoch": 0.7573017699599978,
	"grad_norm": 1.5564959049224854,
	"learning_rate": 0.0001,
	"loss": 0.6997,
	"step": 13820
	},
	{
	"epoch": 0.7583977204230369,
	"grad_norm": 1.848569393157959,
	"learning_rate": 0.0001,
	"loss": 0.6836,
	"step": 13840
	},
	{
	"epoch": 0.759493670886076,
	"grad_norm": 1.5552887916564941,
	"learning_rate": 0.0001,
	"loss": 0.6014,
	"step": 13860
	},
	{
	"epoch": 0.760589621349115,
	"grad_norm": 1.5576545000076294,
	"learning_rate": 0.0001,
	"loss": 0.7034,
	"step": 13880
	},
	{
	"epoch": 0.7616855718121541,
	"grad_norm": 1.795949935913086,
	"learning_rate": 0.0001,
	"loss": 0.7322,
	"step": 13900
	},
	{
	"epoch": 0.7627815222751931,
	"grad_norm": 1.498818039894104,
	"learning_rate": 0.0001,
	"loss": 0.697,
	"step": 13920
	},
	{
	"epoch": 0.7638774727382323,
	"grad_norm": 1.7154011726379395,
	"learning_rate": 0.0001,
	"loss": 0.7057,
	"step": 13940
	},
	{
	"epoch": 0.7649734232012713,
	"grad_norm": 1.693199872970581,
	"learning_rate": 0.0001,
	"loss": 0.722,
	"step": 13960
	},
	{
	"epoch": 0.7660693736643104,
	"grad_norm": 1.7617517709732056,
	"learning_rate": 0.0001,
	"loss": 0.727,
	"step": 13980
	},
	{
	"epoch": 0.7671653241273494,
	"grad_norm": 1.7693978548049927,
	"learning_rate": 0.0001,
	"loss": 0.6552,
	"step": 14000
	},
	{
	"epoch": 0.7671653241273494,
	"eval_loss": 0.6688939929008484,
	"eval_runtime": 30450.1084,
	"eval_samples_per_second": 2.131,
	"eval_steps_per_second": 0.067,
	"eval_wer": 38.925884967114385,
	"step": 14000
	},
	{
	"epoch": 0.7682612745903885,
	"grad_norm": 1.531043529510498,
	"learning_rate": 0.0001,
	"loss": 0.6237,
	"step": 14020
	},
	{
	"epoch": 0.7693572250534276,
	"grad_norm": 1.7747310400009155,
	"learning_rate": 0.0001,
	"loss": 0.6769,
	"step": 14040
	},
	{
	"epoch": 0.7704531755164666,
	"grad_norm": 1.457766056060791,
	"learning_rate": 0.0001,
	"loss": 0.6406,
	"step": 14060
	},
	{
	"epoch": 0.7715491259795058,
	"grad_norm": 1.478061318397522,
	"learning_rate": 0.0001,
	"loss": 0.6797,
	"step": 14080
	},
	{
	"epoch": 0.7726450764425448,
	"grad_norm": 1.462485909461975,
	"learning_rate": 0.0001,
	"loss": 0.654,
	"step": 14100
	},
	{
	"epoch": 0.7737410269055839,
	"grad_norm": 2.1201417446136475,
	"learning_rate": 0.0001,
	"loss": 0.676,
	"step": 14120
	},
	{
	"epoch": 0.7748369773686229,
	"grad_norm": 1.6672828197479248,
	"learning_rate": 0.0001,
	"loss": 0.6402,
	"step": 14140
	},
	{
	"epoch": 0.775932927831662,
	"grad_norm": 1.848254680633545,
	"learning_rate": 0.0001,
	"loss": 0.6623,
	"step": 14160
	},
	{
	"epoch": 0.7770288782947011,
	"grad_norm": 1.8868560791015625,
	"learning_rate": 0.0001,
	"loss": 0.6598,
	"step": 14180
	},
	{
	"epoch": 0.7781248287577401,
	"grad_norm": 2.0615594387054443,
	"learning_rate": 0.0001,
	"loss": 0.6786,
	"step": 14200
	},
	{
	"epoch": 0.7792207792207793,
	"grad_norm": 1.6596072912216187,
	"learning_rate": 0.0001,
	"loss": 0.6448,
	"step": 14220
	},
	{
	"epoch": 0.7803167296838183,
	"grad_norm": 2.0829083919525146,
	"learning_rate": 0.0001,
	"loss": 0.6558,
	"step": 14240
	},
	{
	"epoch": 0.7814126801468574,
	"grad_norm": 1.7660095691680908,
	"learning_rate": 0.0001,
	"loss": 0.7399,
	"step": 14260
	},
	{
	"epoch": 0.7825086306098964,
	"grad_norm": 1.7068332433700562,
	"learning_rate": 0.0001,
	"loss": 0.637,
	"step": 14280
	},
	{
	"epoch": 0.7836045810729355,
	"grad_norm": 1.5040172338485718,
	"learning_rate": 0.0001,
	"loss": 0.5708,
	"step": 14300
	},
	{
	"epoch": 0.7847005315359745,
	"grad_norm": 1.7479969263076782,
	"learning_rate": 0.0001,
	"loss": 0.7348,
	"step": 14320
	},
	{
	"epoch": 0.7857964819990136,
	"grad_norm": 1.7886347770690918,
	"learning_rate": 0.0001,
	"loss": 0.72,
	"step": 14340
	},
	{
	"epoch": 0.7868924324620528,
	"grad_norm": 1.6001741886138916,
	"learning_rate": 0.0001,
	"loss": 0.6512,
	"step": 14360
	},
	{
	"epoch": 0.7879883829250918,
	"grad_norm": 1.7489492893218994,
	"learning_rate": 0.0001,
	"loss": 0.6714,
	"step": 14380
	},
	{
	"epoch": 0.7890843333881309,
	"grad_norm": 1.9967806339263916,
	"learning_rate": 0.0001,
	"loss": 0.6651,
	"step": 14400
	},
	{
	"epoch": 0.7901802838511699,
	"grad_norm": 1.6555088758468628,
	"learning_rate": 0.0001,
	"loss": 0.6584,
	"step": 14420
	},
	{
	"epoch": 0.791276234314209,
	"grad_norm": 1.589168667793274,
	"learning_rate": 0.0001,
	"loss": 0.6448,
	"step": 14440
	},
	{
	"epoch": 0.792372184777248,
	"grad_norm": 1.2876309156417847,
	"learning_rate": 0.0001,
	"loss": 0.6612,
	"step": 14460
	},
	{
	"epoch": 0.7934681352402871,
	"grad_norm": 1.6673985719680786,
	"learning_rate": 0.0001,
	"loss": 0.5769,
	"step": 14480
	},
	{
	"epoch": 0.7945640857033263,
	"grad_norm": 1.6478184461593628,
	"learning_rate": 0.0001,
	"loss": 0.6457,
	"step": 14500
	},
	{
	"epoch": 0.7956600361663653,
	"grad_norm": 1.5702099800109863,
	"learning_rate": 0.0001,
	"loss": 0.6866,
	"step": 14520
	},
	{
	"epoch": 0.7967559866294044,
	"grad_norm": 1.850900411605835,
	"learning_rate": 0.0001,
	"loss": 0.6475,
	"step": 14540
	},
	{
	"epoch": 0.7978519370924434,
	"grad_norm": 1.2784024477005005,
	"learning_rate": 0.0001,
	"loss": 0.6366,
	"step": 14560
	},
	{
	"epoch": 0.7989478875554825,
	"grad_norm": 2.2533817291259766,
	"learning_rate": 0.0001,
	"loss": 0.6164,
	"step": 14580
	},
	{
	"epoch": 0.8000438380185215,
	"grad_norm": 1.442713737487793,
	"learning_rate": 0.0001,
	"loss": 0.6853,
	"step": 14600
	},
	{
	"epoch": 0.8011397884815606,
	"grad_norm": 1.594449520111084,
	"learning_rate": 0.0001,
	"loss": 0.6535,
	"step": 14620
	},
	{
	"epoch": 0.8022357389445997,
	"grad_norm": 1.4961411952972412,
	"learning_rate": 0.0001,
	"loss": 0.6696,
	"step": 14640
	},
	{
	"epoch": 0.8033316894076388,
	"grad_norm": 2.1010756492614746,
	"learning_rate": 0.0001,
	"loss": 0.6607,
	"step": 14660
	},
	{
	"epoch": 0.8044276398706779,
	"grad_norm": 2.134493589401245,
	"learning_rate": 0.0001,
	"loss": 0.6512,
	"step": 14680
	},
	{
	"epoch": 0.8055235903337169,
	"grad_norm": 1.6435072422027588,
	"learning_rate": 0.0001,
	"loss": 0.6094,
	"step": 14700
	},
	{
	"epoch": 0.806619540796756,
	"grad_norm": 1.8982771635055542,
	"learning_rate": 0.0001,
	"loss": 0.6761,
	"step": 14720
	},
	{
	"epoch": 0.807715491259795,
	"grad_norm": 1.968770146369934,
	"learning_rate": 0.0001,
	"loss": 0.7178,
	"step": 14740
	},
	{
	"epoch": 0.8088114417228341,
	"grad_norm": 2.19568133354187,
	"learning_rate": 0.0001,
	"loss": 0.6246,
	"step": 14760
	},
	{
	"epoch": 0.8099073921858732,
	"grad_norm": 1.6024566888809204,
	"learning_rate": 0.0001,
	"loss": 0.6174,
	"step": 14780
	},
	{
	"epoch": 0.8110033426489123,
	"grad_norm": 1.4896485805511475,
	"learning_rate": 0.0001,
	"loss": 0.5843,
	"step": 14800
	},
	{
	"epoch": 0.8120992931119514,
	"grad_norm": 1.502487301826477,
	"learning_rate": 0.0001,
	"loss": 0.7747,
	"step": 14820
	},
	{
	"epoch": 0.8131952435749904,
	"grad_norm": 1.5037872791290283,
	"learning_rate": 0.0001,
	"loss": 0.6745,
	"step": 14840
	},
	{
	"epoch": 0.8142911940380295,
	"grad_norm": 1.3984043598175049,
	"learning_rate": 0.0001,
	"loss": 0.6938,
	"step": 14860
	},
	{
	"epoch": 0.8153871445010685,
	"grad_norm": 1.7627023458480835,
	"learning_rate": 0.0001,
	"loss": 0.6407,
	"step": 14880
	},
	{
	"epoch": 0.8164830949641076,
	"grad_norm": 1.5276484489440918,
	"learning_rate": 0.0001,
	"loss": 0.6142,
	"step": 14900
	},
	{
	"epoch": 0.8175790454271467,
	"grad_norm": 1.598743200302124,
	"learning_rate": 0.0001,
	"loss": 0.6534,
	"step": 14920
	},
	{
	"epoch": 0.8186749958901858,
	"grad_norm": 1.5528680086135864,
	"learning_rate": 0.0001,
	"loss": 0.6272,
	"step": 14940
	},
	{
	"epoch": 0.8197709463532248,
	"grad_norm": 1.71839439868927,
	"learning_rate": 0.0001,
	"loss": 0.7259,
	"step": 14960
	},
	{
	"epoch": 0.8208668968162639,
	"grad_norm": 1.5527739524841309,
	"learning_rate": 0.0001,
	"loss": 0.6387,
	"step": 14980
	},
	{
	"epoch": 0.821962847279303,
	"grad_norm": 1.7775479555130005,
	"learning_rate": 0.0001,
	"loss": 0.6963,
	"step": 15000
	},
	{
	"epoch": 0.821962847279303,
	"eval_loss": 0.6593644618988037,
	"eval_runtime": 30360.7703,
	"eval_samples_per_second": 2.137,
	"eval_steps_per_second": 0.067,
	"eval_wer": 42.68128173436093,
	"step": 15000
	},
	{
	"epoch": 0.823058797742342,
	"grad_norm": 1.772290825843811,
	"learning_rate": 0.0001,
	"loss": 0.6439,
	"step": 15020
	},
	{
	"epoch": 0.8241547482053811,
	"grad_norm": 1.655604600906372,
	"learning_rate": 0.0001,
	"loss": 0.7521,
	"step": 15040
	},
	{
	"epoch": 0.8252506986684202,
	"grad_norm": 1.5305246114730835,
	"learning_rate": 0.0001,
	"loss": 0.5623,
	"step": 15060
	},
	{
	"epoch": 0.8263466491314593,
	"grad_norm": 1.399568796157837,
	"learning_rate": 0.0001,
	"loss": 0.634,
	"step": 15080
	},
	{
	"epoch": 0.8274425995944983,
	"grad_norm": 1.412463903427124,
	"learning_rate": 0.0001,
	"loss": 0.7272,
	"step": 15100
	},
	{
	"epoch": 0.8285385500575374,
	"grad_norm": 1.793396234512329,
	"learning_rate": 0.0001,
	"loss": 0.684,
	"step": 15120
	},
	{
	"epoch": 0.8296345005205765,
	"grad_norm": 1.9623442888259888,
	"learning_rate": 0.0001,
	"loss": 0.6247,
	"step": 15140
	},
	{
	"epoch": 0.8307304509836155,
	"grad_norm": 1.4576257467269897,
	"learning_rate": 0.0001,
	"loss": 0.675,
	"step": 15160
	},
	{
	"epoch": 0.8318264014466547,
	"grad_norm": 1.6135623455047607,
	"learning_rate": 0.0001,
	"loss": 0.7046,
	"step": 15180
	},
	{
	"epoch": 0.8329223519096937,
	"grad_norm": 1.5553112030029297,
	"learning_rate": 0.0001,
	"loss": 0.7246,
	"step": 15200
	},
	{
	"epoch": 0.8340183023727328,
	"grad_norm": 1.4521915912628174,
	"learning_rate": 0.0001,
	"loss": 0.7288,
	"step": 15220
	},
	{
	"epoch": 0.8351142528357718,
	"grad_norm": 1.429190754890442,
	"learning_rate": 0.0001,
	"loss": 0.6357,
	"step": 15240
	},
	{
	"epoch": 0.8362102032988109,
	"grad_norm": 1.80194890499115,
	"learning_rate": 0.0001,
	"loss": 0.6462,
	"step": 15260
	},
	{
	"epoch": 0.8373061537618499,
	"grad_norm": 1.833225131034851,
	"learning_rate": 0.0001,
	"loss": 0.6942,
	"step": 15280
	},
	{
	"epoch": 0.838402104224889,
	"grad_norm": 1.8329098224639893,
	"learning_rate": 0.0001,
	"loss": 0.6525,
	"step": 15300
	},
	{
	"epoch": 0.8394980546879282,
	"grad_norm": 1.5729244947433472,
	"learning_rate": 0.0001,
	"loss": 0.6721,
	"step": 15320
	},
	{
	"epoch": 0.8405940051509672,
	"grad_norm": 1.8156899213790894,
	"learning_rate": 0.0001,
	"loss": 0.6777,
	"step": 15340
	},
	{
	"epoch": 0.8416899556140063,
	"grad_norm": 1.7255985736846924,
	"learning_rate": 0.0001,
	"loss": 0.6653,
	"step": 15360
	},
	{
	"epoch": 0.8427859060770453,
	"grad_norm": 1.8051388263702393,
	"learning_rate": 0.0001,
	"loss": 0.6429,
	"step": 15380
	},
	{
	"epoch": 0.8438818565400844,
	"grad_norm": 1.4799489974975586,
	"learning_rate": 0.0001,
	"loss": 0.6219,
	"step": 15400
	},
	{
	"epoch": 0.8449778070031234,
	"grad_norm": 1.5661497116088867,
	"learning_rate": 0.0001,
	"loss": 0.7042,
	"step": 15420
	},
	{
	"epoch": 0.8460737574661625,
	"grad_norm": 1.7842859029769897,
	"learning_rate": 0.0001,
	"loss": 0.5657,
	"step": 15440
	},
	{
	"epoch": 0.8471697079292017,
	"grad_norm": 2.036591053009033,
	"learning_rate": 0.0001,
	"loss": 0.7448,
	"step": 15460
	},
	{
	"epoch": 0.8482656583922407,
	"grad_norm": 1.5923106670379639,
	"learning_rate": 0.0001,
	"loss": 0.6937,
	"step": 15480
	},
	{
	"epoch": 0.8493616088552798,
	"grad_norm": 1.7609819173812866,
	"learning_rate": 0.0001,
	"loss": 0.6282,
	"step": 15500
	},
	{
	"epoch": 0.8504575593183188,
	"grad_norm": 1.627193570137024,
	"learning_rate": 0.0001,
	"loss": 0.6593,
	"step": 15520
	},
	{
	"epoch": 0.8515535097813579,
	"grad_norm": 1.5199600458145142,
	"learning_rate": 0.0001,
	"loss": 0.6493,
	"step": 15540
	},
	{
	"epoch": 0.8526494602443969,
	"grad_norm": 1.8375046253204346,
	"learning_rate": 0.0001,
	"loss": 0.7139,
	"step": 15560
	},
	{
	"epoch": 0.853745410707436,
	"grad_norm": 1.7061831951141357,
	"learning_rate": 0.0001,
	"loss": 0.645,
	"step": 15580
	},
	{
	"epoch": 0.854841361170475,
	"grad_norm": 1.5046154260635376,
	"learning_rate": 0.0001,
	"loss": 0.7154,
	"step": 15600
	},
	{
	"epoch": 0.8559373116335142,
	"grad_norm": 2.0937325954437256,
	"learning_rate": 0.0001,
	"loss": 0.716,
	"step": 15620
	},
	{
	"epoch": 0.8570332620965533,
	"grad_norm": 1.502930760383606,
	"learning_rate": 0.0001,
	"loss": 0.6476,
	"step": 15640
	},
	{
	"epoch": 0.8581292125595923,
	"grad_norm": 1.832287073135376,
	"learning_rate": 0.0001,
	"loss": 0.6279,
	"step": 15660
	},
	{
	"epoch": 0.8592251630226314,
	"grad_norm": 1.9679219722747803,
	"learning_rate": 0.0001,
	"loss": 0.7048,
	"step": 15680
	},
	{
	"epoch": 0.8603211134856704,
	"grad_norm": 1.4660624265670776,
	"learning_rate": 0.0001,
	"loss": 0.6217,
	"step": 15700
	},
	{
	"epoch": 0.8614170639487095,
	"grad_norm": 1.6641209125518799,
	"learning_rate": 0.0001,
	"loss": 0.5692,
	"step": 15720
	},
	{
	"epoch": 0.8625130144117485,
	"grad_norm": 1.6354645490646362,
	"learning_rate": 0.0001,
	"loss": 0.7019,
	"step": 15740
	},
	{
	"epoch": 0.8636089648747877,
	"grad_norm": 1.5404868125915527,
	"learning_rate": 0.0001,
	"loss": 0.667,
	"step": 15760
	},
	{
	"epoch": 0.8647049153378268,
	"grad_norm": 1.759466528892517,
	"learning_rate": 0.0001,
	"loss": 0.7413,
	"step": 15780
	},
	{
	"epoch": 0.8658008658008658,
	"grad_norm": 1.289501667022705,
	"learning_rate": 0.0001,
	"loss": 0.6696,
	"step": 15800
	},
	{
	"epoch": 0.8668968162639049,
	"grad_norm": 1.516506552696228,
	"learning_rate": 0.0001,
	"loss": 0.6385,
	"step": 15820
	},
	{
	"epoch": 0.8679927667269439,
	"grad_norm": 1.602023959159851,
	"learning_rate": 0.0001,
	"loss": 0.6034,
	"step": 15840
	},
	{
	"epoch": 0.869088717189983,
	"grad_norm": 1.6681197881698608,
	"learning_rate": 0.0001,
	"loss": 0.6524,
	"step": 15860
	},
	{
	"epoch": 0.870184667653022,
	"grad_norm": 1.7448092699050903,
	"learning_rate": 0.0001,
	"loss": 0.5845,
	"step": 15880
	},
	{
	"epoch": 0.8712806181160612,
	"grad_norm": 1.763609766960144,
	"learning_rate": 0.0001,
	"loss": 0.6078,
	"step": 15900
	},
	{
	"epoch": 0.8723765685791002,
	"grad_norm": 1.8752708435058594,
	"learning_rate": 0.0001,
	"loss": 0.6415,
	"step": 15920
	},
	{
	"epoch": 0.8734725190421393,
	"grad_norm": 1.4633687734603882,
	"learning_rate": 0.0001,
	"loss": 0.6509,
	"step": 15940
	},
	{
	"epoch": 0.8745684695051784,
	"grad_norm": 1.630188226699829,
	"learning_rate": 0.0001,
	"loss": 0.678,
	"step": 15960
	},
	{
	"epoch": 0.8756644199682174,
	"grad_norm": 1.746390461921692,
	"learning_rate": 0.0001,
	"loss": 0.6883,
	"step": 15980
	},
	{
	"epoch": 0.8767603704312565,
	"grad_norm": 1.8357354402542114,
	"learning_rate": 0.0001,
	"loss": 0.5674,
	"step": 16000
	},
	{
	"epoch": 0.8767603704312565,
	"eval_loss": 0.6495629549026489,
	"eval_runtime": 30578.7623,
	"eval_samples_per_second": 2.122,
	"eval_steps_per_second": 0.066,
	"eval_wer": 46.744478263995646,
	"step": 16000
	},
	{
	"epoch": 0.8778563208942955,
	"grad_norm": 1.3959294557571411,
	"learning_rate": 0.0001,
	"loss": 0.7334,
	"step": 16020
	},
	{
	"epoch": 0.8789522713573347,
	"grad_norm": 1.7587610483169556,
	"learning_rate": 0.0001,
	"loss": 0.6916,
	"step": 16040
	},
	{
	"epoch": 0.8800482218203737,
	"grad_norm": 2.157567024230957,
	"learning_rate": 0.0001,
	"loss": 0.6288,
	"step": 16060
	},
	{
	"epoch": 0.8811441722834128,
	"grad_norm": 1.927071452140808,
	"learning_rate": 0.0001,
	"loss": 0.6596,
	"step": 16080
	},
	{
	"epoch": 0.8822401227464519,
	"grad_norm": 1.7229890823364258,
	"learning_rate": 0.0001,
	"loss": 0.6351,
	"step": 16100
	},
	{
	"epoch": 0.8833360732094909,
	"grad_norm": 1.4584635496139526,
	"learning_rate": 0.0001,
	"loss": 0.6347,
	"step": 16120
	},
	{
	"epoch": 0.88443202367253,
	"grad_norm": 1.4768098592758179,
	"learning_rate": 0.0001,
	"loss": 0.6326,
	"step": 16140
	},
	{
	"epoch": 0.885527974135569,
	"grad_norm": 1.6411234140396118,
	"learning_rate": 0.0001,
	"loss": 0.6935,
	"step": 16160
	},
	{
	"epoch": 0.8866239245986082,
	"grad_norm": 1.4742987155914307,
	"learning_rate": 0.0001,
	"loss": 0.6188,
	"step": 16180
	},
	{
	"epoch": 0.8877198750616472,
	"grad_norm": 2.1708977222442627,
	"learning_rate": 0.0001,
	"loss": 0.6837,
	"step": 16200
	},
	{
	"epoch": 0.8888158255246863,
	"grad_norm": 1.5142560005187988,
	"learning_rate": 0.0001,
	"loss": 0.6218,
	"step": 16220
	},
	{
	"epoch": 0.8899117759877253,
	"grad_norm": 1.5650640726089478,
	"learning_rate": 0.0001,
	"loss": 0.5991,
	"step": 16240
	},
	{
	"epoch": 0.8910077264507644,
	"grad_norm": 1.5553919076919556,
	"learning_rate": 0.0001,
	"loss": 0.6081,
	"step": 16260
	},
	{
	"epoch": 0.8921036769138035,
	"grad_norm": 1.813482642173767,
	"learning_rate": 0.0001,
	"loss": 0.6599,
	"step": 16280
	},
	{
	"epoch": 0.8931996273768426,
	"grad_norm": 1.6864385604858398,
	"learning_rate": 0.0001,
	"loss": 0.6337,
	"step": 16300
	},
	{
	"epoch": 0.8942955778398817,
	"grad_norm": 1.5707799196243286,
	"learning_rate": 0.0001,
	"loss": 0.7029,
	"step": 16320
	},
	{
	"epoch": 0.8953915283029207,
	"grad_norm": 1.3465133905410767,
	"learning_rate": 0.0001,
	"loss": 0.6519,
	"step": 16340
	},
	{
	"epoch": 0.8964874787659598,
	"grad_norm": 1.5546880960464478,
	"learning_rate": 0.0001,
	"loss": 0.6111,
	"step": 16360
	},
	{
	"epoch": 0.8975834292289988,
	"grad_norm": 1.6297564506530762,
	"learning_rate": 0.0001,
	"loss": 0.6825,
	"step": 16380
	},
	{
	"epoch": 0.8986793796920379,
	"grad_norm": 1.5396370887756348,
	"learning_rate": 0.0001,
	"loss": 0.6454,
	"step": 16400
	},
	{
	"epoch": 0.8997753301550769,
	"grad_norm": 1.3082808256149292,
	"learning_rate": 0.0001,
	"loss": 0.6489,
	"step": 16420
	},
	{
	"epoch": 0.900871280618116,
	"grad_norm": 1.68564772605896,
	"learning_rate": 0.0001,
	"loss": 0.6688,
	"step": 16440
	},
	{
	"epoch": 0.9019672310811552,
	"grad_norm": 1.6919423341751099,
	"learning_rate": 0.0001,
	"loss": 0.6353,
	"step": 16460
	},
	{
	"epoch": 0.9030631815441942,
	"grad_norm": 1.4040336608886719,
	"learning_rate": 0.0001,
	"loss": 0.6286,
	"step": 16480
	},
	{
	"epoch": 0.9041591320072333,
	"grad_norm": 1.5394583940505981,
	"learning_rate": 0.0001,
	"loss": 0.648,
	"step": 16500
	},
	{
	"epoch": 0.9052550824702723,
	"grad_norm": 1.8135911226272583,
	"learning_rate": 0.0001,
	"loss": 0.6315,
	"step": 16520
	},
	{
	"epoch": 0.9063510329333114,
	"grad_norm": 1.6827434301376343,
	"learning_rate": 0.0001,
	"loss": 0.637,
	"step": 16540
	},
	{
	"epoch": 0.9074469833963504,
	"grad_norm": 1.3692152500152588,
	"learning_rate": 0.0001,
	"loss": 0.7015,
	"step": 16560
	},
	{
	"epoch": 0.9085429338593896,
	"grad_norm": 1.6391196250915527,
	"learning_rate": 0.0001,
	"loss": 0.6479,
	"step": 16580
	},
	{
	"epoch": 0.9096388843224287,
	"grad_norm": 2.5071117877960205,
	"learning_rate": 0.0001,
	"loss": 0.6746,
	"step": 16600
	},
	{
	"epoch": 0.9107348347854677,
	"grad_norm": 1.7680779695510864,
	"learning_rate": 0.0001,
	"loss": 0.6543,
	"step": 16620
	},
	{
	"epoch": 0.9118307852485068,
	"grad_norm": 1.487269639968872,
	"learning_rate": 0.0001,
	"loss": 0.618,
	"step": 16640
	},
	{
	"epoch": 0.9129267357115458,
	"grad_norm": 1.322325348854065,
	"learning_rate": 0.0001,
	"loss": 0.635,
	"step": 16660
	},
	{
	"epoch": 0.9140226861745849,
	"grad_norm": 2.054997682571411,
	"learning_rate": 0.0001,
	"loss": 0.645,
	"step": 16680
	},
	{
	"epoch": 0.9151186366376239,
	"grad_norm": 1.7619165182113647,
	"learning_rate": 0.0001,
	"loss": 0.6405,
	"step": 16700
	},
	{
	"epoch": 0.9162145871006631,
	"grad_norm": 1.3276571035385132,
	"learning_rate": 0.0001,
	"loss": 0.5797,
	"step": 16720
	},
	{
	"epoch": 0.9173105375637021,
	"grad_norm": 2.2796542644500732,
	"learning_rate": 0.0001,
	"loss": 0.7342,
	"step": 16740
	},
	{
	"epoch": 0.9184064880267412,
	"grad_norm": 1.637654423713684,
	"learning_rate": 0.0001,
	"loss": 0.6149,
	"step": 16760
	},
	{
	"epoch": 0.9195024384897803,
	"grad_norm": 1.4013864994049072,
	"learning_rate": 0.0001,
	"loss": 0.627,
	"step": 16780
	},
	{
	"epoch": 0.9205983889528193,
	"grad_norm": 1.5173211097717285,
	"learning_rate": 0.0001,
	"loss": 0.5449,
	"step": 16800
	},
	{
	"epoch": 0.9216943394158584,
	"grad_norm": 1.5530805587768555,
	"learning_rate": 0.0001,
	"loss": 0.5416,
	"step": 16820
	},
	{
	"epoch": 0.9227902898788974,
	"grad_norm": 1.5294363498687744,
	"learning_rate": 0.0001,
	"loss": 0.6146,
	"step": 16840
	},
	{
	"epoch": 0.9238862403419366,
	"grad_norm": 1.7312266826629639,
	"learning_rate": 0.0001,
	"loss": 0.6952,
	"step": 16860
	},
	{
	"epoch": 0.9249821908049756,
	"grad_norm": 1.301459789276123,
	"learning_rate": 0.0001,
	"loss": 0.6258,
	"step": 16880
	},
	{
	"epoch": 0.9260781412680147,
	"grad_norm": 1.915128469467163,
	"learning_rate": 0.0001,
	"loss": 0.6955,
	"step": 16900
	},
	{
	"epoch": 0.9271740917310538,
	"grad_norm": 1.3437505960464478,
	"learning_rate": 0.0001,
	"loss": 0.7044,
	"step": 16920
	},
	{
	"epoch": 0.9282700421940928,
	"grad_norm": 1.5920603275299072,
	"learning_rate": 0.0001,
	"loss": 0.5871,
	"step": 16940
	},
	{
	"epoch": 0.9293659926571319,
	"grad_norm": 1.2615900039672852,
	"learning_rate": 0.0001,
	"loss": 0.6311,
	"step": 16960
	},
	{
	"epoch": 0.9304619431201709,
	"grad_norm": 1.6863378286361694,
	"learning_rate": 0.0001,
	"loss": 0.5746,
	"step": 16980
	},
	{
	"epoch": 0.9315578935832101,
	"grad_norm": 1.3633450269699097,
	"learning_rate": 0.0001,
	"loss": 0.6354,
	"step": 17000
	},
	{
	"epoch": 0.9315578935832101,
	"eval_loss": 0.6385661959648132,
	"eval_runtime": 30462.2265,
	"eval_samples_per_second": 2.13,
	"eval_steps_per_second": 0.067,
	"eval_wer": 36.07830918982583,
	"step": 17000
	},
	{
	"epoch": 0.9326538440462491,
	"grad_norm": 1.7412103414535522,
	"learning_rate": 0.0001,
	"loss": 0.6635,
	"step": 17020
	},
	{
	"epoch": 0.9337497945092882,
	"grad_norm": 2.0697691440582275,
	"learning_rate": 0.0001,
	"loss": 0.678,
	"step": 17040
	},
	{
	"epoch": 0.9348457449723272,
	"grad_norm": 1.6238869428634644,
	"learning_rate": 0.0001,
	"loss": 0.6427,
	"step": 17060
	},
	{
	"epoch": 0.9359416954353663,
	"grad_norm": 1.498334288597107,
	"learning_rate": 0.0001,
	"loss": 0.614,
	"step": 17080
	},
	{
	"epoch": 0.9370376458984054,
	"grad_norm": 1.4905815124511719,
	"learning_rate": 0.0001,
	"loss": 0.5759,
	"step": 17100
	},
	{
	"epoch": 0.9381335963614444,
	"grad_norm": 1.433747410774231,
	"learning_rate": 0.0001,
	"loss": 0.6754,
	"step": 17120
	},
	{
	"epoch": 0.9392295468244836,
	"grad_norm": 1.8419586420059204,
	"learning_rate": 0.0001,
	"loss": 0.6392,
	"step": 17140
	},
	{
	"epoch": 0.9403254972875226,
	"grad_norm": 1.5990883111953735,
	"learning_rate": 0.0001,
	"loss": 0.6204,
	"step": 17160
	},
	{
	"epoch": 0.9414214477505617,
	"grad_norm": 1.482010841369629,
	"learning_rate": 0.0001,
	"loss": 0.6887,
	"step": 17180
	},
	{
	"epoch": 0.9425173982136007,
	"grad_norm": 1.6629010438919067,
	"learning_rate": 0.0001,
	"loss": 0.6457,
	"step": 17200
	},
	{
	"epoch": 0.9436133486766398,
	"grad_norm": 1.4538336992263794,
	"learning_rate": 0.0001,
	"loss": 0.6401,
	"step": 17220
	},
	{
	"epoch": 0.9447092991396789,
	"grad_norm": 1.5684305429458618,
	"learning_rate": 0.0001,
	"loss": 0.676,
	"step": 17240
	},
	{
	"epoch": 0.945805249602718,
	"grad_norm": 1.4637812376022339,
	"learning_rate": 0.0001,
	"loss": 0.5963,
	"step": 17260
	},
	{
	"epoch": 0.9469012000657571,
	"grad_norm": 2.155348300933838,
	"learning_rate": 0.0001,
	"loss": 0.6624,
	"step": 17280
	},
	{
	"epoch": 0.9479971505287961,
	"grad_norm": 1.6532953977584839,
	"learning_rate": 0.0001,
	"loss": 0.6784,
	"step": 17300
	},
	{
	"epoch": 0.9490931009918352,
	"grad_norm": 1.934787392616272,
	"learning_rate": 0.0001,
	"loss": 0.6876,
	"step": 17320
	},
	{
	"epoch": 0.9501890514548742,
	"grad_norm": 2.319920063018799,
	"learning_rate": 0.0001,
	"loss": 0.7676,
	"step": 17340
	},
	{
	"epoch": 0.9512850019179133,
	"grad_norm": 1.5026947259902954,
	"learning_rate": 0.0001,
	"loss": 0.5634,
	"step": 17360
	},
	{
	"epoch": 0.9523809523809523,
	"grad_norm": 1.9578672647476196,
	"learning_rate": 0.0001,
	"loss": 0.5959,
	"step": 17380
	},
	{
	"epoch": 0.9534769028439914,
	"grad_norm": 1.9930877685546875,
	"learning_rate": 0.0001,
	"loss": 0.5947,
	"step": 17400
	},
	{
	"epoch": 0.9545728533070306,
	"grad_norm": 1.6241062879562378,
	"learning_rate": 0.0001,
	"loss": 0.587,
	"step": 17420
	},
	{
	"epoch": 0.9556688037700696,
	"grad_norm": 1.7155011892318726,
	"learning_rate": 0.0001,
	"loss": 0.6352,
	"step": 17440
	},
	{
	"epoch": 0.9567647542331087,
	"grad_norm": 1.7239856719970703,
	"learning_rate": 0.0001,
	"loss": 0.647,
	"step": 17460
	},
	{
	"epoch": 0.9578607046961477,
	"grad_norm": 1.6342066526412964,
	"learning_rate": 0.0001,
	"loss": 0.6017,
	"step": 17480
	},
	{
	"epoch": 0.9589566551591868,
	"grad_norm": 1.4042915105819702,
	"learning_rate": 0.0001,
	"loss": 0.6479,
	"step": 17500
	},
	{
	"epoch": 0.9600526056222258,
	"grad_norm": 1.5023634433746338,
	"learning_rate": 0.0001,
	"loss": 0.6008,
	"step": 17520
	},
	{
	"epoch": 0.961148556085265,
	"grad_norm": 1.5713409185409546,
	"learning_rate": 0.0001,
	"loss": 0.6643,
	"step": 17540
	},
	{
	"epoch": 0.9622445065483041,
	"grad_norm": 1.8917444944381714,
	"learning_rate": 0.0001,
	"loss": 0.6992,
	"step": 17560
	},
	{
	"epoch": 0.9633404570113431,
	"grad_norm": 1.918900728225708,
	"learning_rate": 0.0001,
	"loss": 0.6004,
	"step": 17580
	},
	{
	"epoch": 0.9644364074743822,
	"grad_norm": 1.7599738836288452,
	"learning_rate": 0.0001,
	"loss": 0.6479,
	"step": 17600
	},
	{
	"epoch": 0.9655323579374212,
	"grad_norm": 1.4554500579833984,
	"learning_rate": 0.0001,
	"loss": 0.6367,
	"step": 17620
	},
	{
	"epoch": 0.9666283084004603,
	"grad_norm": 1.6860467195510864,
	"learning_rate": 0.0001,
	"loss": 0.5769,
	"step": 17640
	},
	{
	"epoch": 0.9677242588634993,
	"grad_norm": 1.6800360679626465,
	"learning_rate": 0.0001,
	"loss": 0.6402,
	"step": 17660
	},
	{
	"epoch": 0.9688202093265385,
	"grad_norm": 1.3988690376281738,
	"learning_rate": 0.0001,
	"loss": 0.589,
	"step": 17680
	},
	{
	"epoch": 0.9699161597895775,
	"grad_norm": 1.6789034605026245,
	"learning_rate": 0.0001,
	"loss": 0.6469,
	"step": 17700
	},
	{
	"epoch": 0.9710121102526166,
	"grad_norm": 1.4465025663375854,
	"learning_rate": 0.0001,
	"loss": 0.6362,
	"step": 17720
	},
	{
	"epoch": 0.9721080607156557,
	"grad_norm": 1.6466797590255737,
	"learning_rate": 0.0001,
	"loss": 0.5882,
	"step": 17740
	},
	{
	"epoch": 0.9732040111786947,
	"grad_norm": 1.4487119913101196,
	"learning_rate": 0.0001,
	"loss": 0.6481,
	"step": 17760
	},
	{
	"epoch": 0.9742999616417338,
	"grad_norm": 1.769286870956421,
	"learning_rate": 0.0001,
	"loss": 0.7198,
	"step": 17780
	},
	{
	"epoch": 0.9753959121047728,
	"grad_norm": 1.8515903949737549,
	"learning_rate": 0.0001,
	"loss": 0.6257,
	"step": 17800
	},
	{
	"epoch": 0.976491862567812,
	"grad_norm": 1.9811028242111206,
	"learning_rate": 0.0001,
	"loss": 0.6154,
	"step": 17820
	},
	{
	"epoch": 0.977587813030851,
	"grad_norm": 1.6197538375854492,
	"learning_rate": 0.0001,
	"loss": 0.6196,
	"step": 17840
	},
	{
	"epoch": 0.9786837634938901,
	"grad_norm": 1.605971336364746,
	"learning_rate": 0.0001,
	"loss": 0.5549,
	"step": 17860
	},
	{
	"epoch": 0.9797797139569292,
	"grad_norm": 1.5246946811676025,
	"learning_rate": 0.0001,
	"loss": 0.5979,
	"step": 17880
	},
	{
	"epoch": 0.9808756644199682,
	"grad_norm": 1.8534538745880127,
	"learning_rate": 0.0001,
	"loss": 0.663,
	"step": 17900
	},
	{
	"epoch": 0.9819716148830073,
	"grad_norm": 1.6625508069992065,
	"learning_rate": 0.0001,
	"loss": 0.5863,
	"step": 17920
	},
	{
	"epoch": 0.9830675653460463,
	"grad_norm": 1.704788088798523,
	"learning_rate": 0.0001,
	"loss": 0.6529,
	"step": 17940
	},
	{
	"epoch": 0.9841635158090855,
	"grad_norm": 1.3650102615356445,
	"learning_rate": 0.0001,
	"loss": 0.6317,
	"step": 17960
	},
	{
	"epoch": 0.9852594662721245,
	"grad_norm": 1.7923402786254883,
	"learning_rate": 0.0001,
	"loss": 0.6023,
	"step": 17980
	},
	{
	"epoch": 0.9863554167351636,
	"grad_norm": 2.0028254985809326,
	"learning_rate": 0.0001,
	"loss": 0.6569,
	"step": 18000
	},
	{
	"epoch": 0.9863554167351636,
	"eval_loss": 0.6309429407119751,
	"eval_runtime": 30654.7333,
	"eval_samples_per_second": 2.117,
	"eval_steps_per_second": 0.066,
	"eval_wer": 36.64375002139876,
	"step": 18000
	},
	{
	"epoch": 0.9874513671982026,
	"grad_norm": 1.66196870803833,
	"learning_rate": 0.0001,
	"loss": 0.6687,
	"step": 18020
	},
	{
	"epoch": 0.9885473176612417,
	"grad_norm": 2.031445264816284,
	"learning_rate": 0.0001,
	"loss": 0.6032,
	"step": 18040
	},
	{
	"epoch": 0.9896432681242808,
	"grad_norm": 1.3204675912857056,
	"learning_rate": 0.0001,
	"loss": 0.5913,
	"step": 18060
	},
	{
	"epoch": 0.9907392185873198,
	"grad_norm": 1.7389861345291138,
	"learning_rate": 0.0001,
	"loss": 0.6678,
	"step": 18080
	},
	{
	"epoch": 0.991835169050359,
	"grad_norm": 1.9815995693206787,
	"learning_rate": 0.0001,
	"loss": 0.6566,
	"step": 18100
	},
	{
	"epoch": 0.992931119513398,
	"grad_norm": 1.5902196168899536,
	"learning_rate": 0.0001,
	"loss": 0.617,
	"step": 18120
	},
	{
	"epoch": 0.9940270699764371,
	"grad_norm": 1.4741644859313965,
	"learning_rate": 0.0001,
	"loss": 0.5921,
	"step": 18140
	},
	{
	"epoch": 0.9951230204394761,
	"grad_norm": 1.419965147972107,
	"learning_rate": 0.0001,
	"loss": 0.6031,
	"step": 18160
	},
	{
	"epoch": 0.9962189709025152,
	"grad_norm": 1.5964018106460571,
	"learning_rate": 0.0001,
	"loss": 0.6015,
	"step": 18180
	},
	{
	"epoch": 0.9973149213655543,
	"grad_norm": 1.4470981359481812,
	"learning_rate": 0.0001,
	"loss": 0.6898,
	"step": 18200
	},
	{
	"epoch": 0.9984108718285933,
	"grad_norm": 1.54426908493042,
	"learning_rate": 0.0001,
	"loss": 0.6328,
	"step": 18220
	},
	{
	"epoch": 0.9995068222916325,
	"grad_norm": 1.778437614440918,
	"learning_rate": 0.0001,
	"loss": 0.6381,
	"step": 18240
	},
	{
	"epoch": 1.0006027727546716,
	"grad_norm": 1.5332226753234863,
	"learning_rate": 0.0001,
	"loss": 0.5782,
	"step": 18260
	},
	{
	"epoch": 1.0016987232177106,
	"grad_norm": 1.785762906074524,
	"learning_rate": 0.0001,
	"loss": 0.6779,
	"step": 18280
	},
	{
	"epoch": 1.0027946736807496,
	"grad_norm": 1.684708595275879,
	"learning_rate": 0.0001,
	"loss": 0.5786,
	"step": 18300
	},
	{
	"epoch": 1.0038906241437886,
	"grad_norm": 1.5112040042877197,
	"learning_rate": 0.0001,
	"loss": 0.5989,
	"step": 18320
	},
	{
	"epoch": 1.0049865746068278,
	"grad_norm": 1.5711543560028076,
	"learning_rate": 0.0001,
	"loss": 0.6525,
	"step": 18340
	},
	{
	"epoch": 1.0060825250698668,
	"grad_norm": 1.4053367376327515,
	"learning_rate": 0.0001,
	"loss": 0.5913,
	"step": 18360
	},
	{
	"epoch": 1.0071784755329058,
	"grad_norm": 1.7791050672531128,
	"learning_rate": 0.0001,
	"loss": 0.6212,
	"step": 18380
	},
	{
	"epoch": 1.008274425995945,
	"grad_norm": 1.4202812910079956,
	"learning_rate": 0.0001,
	"loss": 0.6168,
	"step": 18400
	},
	{
	"epoch": 1.009370376458984,
	"grad_norm": 1.7469732761383057,
	"learning_rate": 0.0001,
	"loss": 0.6425,
	"step": 18420
	},
	{
	"epoch": 1.010466326922023,
	"grad_norm": 2.1195449829101562,
	"learning_rate": 0.0001,
	"loss": 0.6564,
	"step": 18440
	},
	{
	"epoch": 1.011562277385062,
	"grad_norm": 1.4056214094161987,
	"learning_rate": 0.0001,
	"loss": 0.6809,
	"step": 18460
	},
	{
	"epoch": 1.0126582278481013,
	"grad_norm": 2.07029128074646,
	"learning_rate": 0.0001,
	"loss": 0.6119,
	"step": 18480
	},
	{
	"epoch": 1.0137541783111403,
	"grad_norm": 1.6518419981002808,
	"learning_rate": 0.0001,
	"loss": 0.5954,
	"step": 18500
	},
	{
	"epoch": 1.0148501287741793,
	"grad_norm": 1.7785189151763916,
	"learning_rate": 0.0001,
	"loss": 0.5959,
	"step": 18520
	},
	{
	"epoch": 1.0159460792372186,
	"grad_norm": 1.4902641773223877,
	"learning_rate": 0.0001,
	"loss": 0.6066,
	"step": 18540
	},
	{
	"epoch": 1.0170420297002576,
	"grad_norm": 1.6291300058364868,
	"learning_rate": 0.0001,
	"loss": 0.5781,
	"step": 18560
	},
	{
	"epoch": 1.0181379801632966,
	"grad_norm": 1.5571300983428955,
	"learning_rate": 0.0001,
	"loss": 0.5622,
	"step": 18580
	},
	{
	"epoch": 1.0192339306263356,
	"grad_norm": 1.5963464975357056,
	"learning_rate": 0.0001,
	"loss": 0.6797,
	"step": 18600
	},
	{
	"epoch": 1.0203298810893748,
	"grad_norm": 1.4604226350784302,
	"learning_rate": 0.0001,
	"loss": 0.6712,
	"step": 18620
	},
	{
	"epoch": 1.0214258315524138,
	"grad_norm": 1.6052221059799194,
	"learning_rate": 0.0001,
	"loss": 0.595,
	"step": 18640
	},
	{
	"epoch": 1.0225217820154529,
	"grad_norm": 1.4075971841812134,
	"learning_rate": 0.0001,
	"loss": 0.6123,
	"step": 18660
	},
	{
	"epoch": 1.0236177324784919,
	"grad_norm": 1.910475730895996,
	"learning_rate": 0.0001,
	"loss": 0.7016,
	"step": 18680
	},
	{
	"epoch": 1.024713682941531,
	"grad_norm": 1.946268081665039,
	"learning_rate": 0.0001,
	"loss": 0.6178,
	"step": 18700
	},
	{
	"epoch": 1.02580963340457,
	"grad_norm": 1.5547478199005127,
	"learning_rate": 0.0001,
	"loss": 0.6068,
	"step": 18720
	},
	{
	"epoch": 1.026905583867609,
	"grad_norm": 1.5006910562515259,
	"learning_rate": 0.0001,
	"loss": 0.5818,
	"step": 18740
	},
	{
	"epoch": 1.0280015343306483,
	"grad_norm": 1.5395736694335938,
	"learning_rate": 0.0001,
	"loss": 0.6614,
	"step": 18760
	},
	{
	"epoch": 1.0290974847936873,
	"grad_norm": 1.5935709476470947,
	"learning_rate": 0.0001,
	"loss": 0.5593,
	"step": 18780
	},
	{
	"epoch": 1.0301934352567264,
	"grad_norm": 1.6643317937850952,
	"learning_rate": 0.0001,
	"loss": 0.6441,
	"step": 18800
	},
	{
	"epoch": 1.0312893857197654,
	"grad_norm": 1.6811660528182983,
	"learning_rate": 0.0001,
	"loss": 0.5663,
	"step": 18820
	},
	{
	"epoch": 1.0323853361828046,
	"grad_norm": 1.4203201532363892,
	"learning_rate": 0.0001,
	"loss": 0.6622,
	"step": 18840
	},
	{
	"epoch": 1.0334812866458436,
	"grad_norm": 1.9712319374084473,
	"learning_rate": 0.0001,
	"loss": 0.5818,
	"step": 18860
	},
	{
	"epoch": 1.0345772371088826,
	"grad_norm": 2.0921614170074463,
	"learning_rate": 0.0001,
	"loss": 0.6489,
	"step": 18880
	},
	{
	"epoch": 1.0356731875719218,
	"grad_norm": 1.3215636014938354,
	"learning_rate": 0.0001,
	"loss": 0.5784,
	"step": 18900
	},
	{
	"epoch": 1.0367691380349608,
	"grad_norm": 1.6520031690597534,
	"learning_rate": 0.0001,
	"loss": 0.6069,
	"step": 18920
	},
	{
	"epoch": 1.0378650884979999,
	"grad_norm": 1.8051795959472656,
	"learning_rate": 0.0001,
	"loss": 0.6596,
	"step": 18940
	},
	{
	"epoch": 1.0389610389610389,
	"grad_norm": 1.7375438213348389,
	"learning_rate": 0.0001,
	"loss": 0.5161,
	"step": 18960
	},
	{
	"epoch": 1.040056989424078,
	"grad_norm": 1.4865177869796753,
	"learning_rate": 0.0001,
	"loss": 0.5436,
	"step": 18980
	},
	{
	"epoch": 1.041152939887117,
	"grad_norm": 1.4444303512573242,
	"learning_rate": 0.0001,
	"loss": 0.5906,
	"step": 19000
	},
	{
	"epoch": 1.041152939887117,
	"eval_loss": 0.622921347618103,
	"eval_runtime": 30997.4799,
	"eval_samples_per_second": 2.093,
	"eval_steps_per_second": 0.065,
	"eval_wer": 37.84105343527132,
	"step": 19000
	},
	{
	"epoch": 1.042248890350156,
	"grad_norm": 1.4964603185653687,
	"learning_rate": 0.0001,
	"loss": 0.6014,
	"step": 19020
	},
	{
	"epoch": 1.0433448408131953,
	"grad_norm": 2.2886295318603516,
	"learning_rate": 0.0001,
	"loss": 0.6472,
	"step": 19040
	},
	{
	"epoch": 1.0444407912762343,
	"grad_norm": 1.7065175771713257,
	"learning_rate": 0.0001,
	"loss": 0.5561,
	"step": 19060
	},
	{
	"epoch": 1.0455367417392734,
	"grad_norm": 1.6928189992904663,
	"learning_rate": 0.0001,
	"loss": 0.5224,
	"step": 19080
	},
	{
	"epoch": 1.0466326922023124,
	"grad_norm": 1.4461798667907715,
	"learning_rate": 0.0001,
	"loss": 0.5549,
	"step": 19100
	},
	{
	"epoch": 1.0477286426653516,
	"grad_norm": 3.3619306087493896,
	"learning_rate": 0.0001,
	"loss": 0.6065,
	"step": 19120
	},
	{
	"epoch": 1.0488245931283906,
	"grad_norm": 1.8468629121780396,
	"learning_rate": 0.0001,
	"loss": 0.716,
	"step": 19140
	},
	{
	"epoch": 1.0499205435914296,
	"grad_norm": 1.7207484245300293,
	"learning_rate": 0.0001,
	"loss": 0.6078,
	"step": 19160
	},
	{
	"epoch": 1.0510164940544688,
	"grad_norm": 1.6650727987289429,
	"learning_rate": 0.0001,
	"loss": 0.6347,
	"step": 19180
	},
	{
	"epoch": 1.0521124445175078,
	"grad_norm": 1.3957616090774536,
	"learning_rate": 0.0001,
	"loss": 0.6265,
	"step": 19200
	},
	{
	"epoch": 1.0532083949805469,
	"grad_norm": 1.4066413640975952,
	"learning_rate": 0.0001,
	"loss": 0.6118,
	"step": 19220
	},
	{
	"epoch": 1.0543043454435859,
	"grad_norm": 1.8007709980010986,
	"learning_rate": 0.0001,
	"loss": 0.6989,
	"step": 19240
	},
	{
	"epoch": 1.055400295906625,
	"grad_norm": 1.4759665727615356,
	"learning_rate": 0.0001,
	"loss": 0.621,
	"step": 19260
	},
	{
	"epoch": 1.056496246369664,
	"grad_norm": 1.7062383890151978,
	"learning_rate": 0.0001,
	"loss": 0.6413,
	"step": 19280
	},
	{
	"epoch": 1.0575921968327031,
	"grad_norm": 1.5822961330413818,
	"learning_rate": 0.0001,
	"loss": 0.5877,
	"step": 19300
	},
	{
	"epoch": 1.0586881472957423,
	"grad_norm": 1.7339930534362793,
	"learning_rate": 0.0001,
	"loss": 0.6121,
	"step": 19320
	},
	{
	"epoch": 1.0597840977587814,
	"grad_norm": 1.3066824674606323,
	"learning_rate": 0.0001,
	"loss": 0.6278,
	"step": 19340
	},
	{
	"epoch": 1.0608800482218204,
	"grad_norm": 1.6953777074813843,
	"learning_rate": 0.0001,
	"loss": 0.624,
	"step": 19360
	},
	{
	"epoch": 1.0619759986848594,
	"grad_norm": 1.5192081928253174,
	"learning_rate": 0.0001,
	"loss": 0.6078,
	"step": 19380
	},
	{
	"epoch": 1.0630719491478986,
	"grad_norm": 1.5474629402160645,
	"learning_rate": 0.0001,
	"loss": 0.7147,
	"step": 19400
	},
	{
	"epoch": 1.0641678996109376,
	"grad_norm": 1.5060781240463257,
	"learning_rate": 0.0001,
	"loss": 0.6342,
	"step": 19420
	},
	{
	"epoch": 1.0652638500739766,
	"grad_norm": 1.4227863550186157,
	"learning_rate": 0.0001,
	"loss": 0.5967,
	"step": 19440
	},
	{
	"epoch": 1.0663598005370156,
	"grad_norm": 1.4965442419052124,
	"learning_rate": 0.0001,
	"loss": 0.6344,
	"step": 19460
	},
	{
	"epoch": 1.0674557510000549,
	"grad_norm": 1.4466912746429443,
	"learning_rate": 0.0001,
	"loss": 0.6276,
	"step": 19480
	},
	{
	"epoch": 1.0685517014630939,
	"grad_norm": 1.7357358932495117,
	"learning_rate": 0.0001,
	"loss": 0.5664,
	"step": 19500
	},
	{
	"epoch": 1.0696476519261329,
	"grad_norm": 1.6092090606689453,
	"learning_rate": 0.0001,
	"loss": 0.6207,
	"step": 19520
	},
	{
	"epoch": 1.070743602389172,
	"grad_norm": 1.5991522073745728,
	"learning_rate": 0.0001,
	"loss": 0.6113,
	"step": 19540
	},
	{
	"epoch": 1.071839552852211,
	"grad_norm": 1.320917010307312,
	"learning_rate": 0.0001,
	"loss": 0.577,
	"step": 19560
	},
	{
	"epoch": 1.0729355033152501,
	"grad_norm": 1.4419164657592773,
	"learning_rate": 0.0001,
	"loss": 0.6622,
	"step": 19580
	},
	{
	"epoch": 1.0740314537782891,
	"grad_norm": 1.7298556566238403,
	"learning_rate": 0.0001,
	"loss": 0.5721,
	"step": 19600
	},
	{
	"epoch": 1.0751274042413284,
	"grad_norm": 1.8013224601745605,
	"learning_rate": 0.0001,
	"loss": 0.6079,
	"step": 19620
	},
	{
	"epoch": 1.0762233547043674,
	"grad_norm": 1.5226448774337769,
	"learning_rate": 0.0001,
	"loss": 0.6681,
	"step": 19640
	},
	{
	"epoch": 1.0773193051674064,
	"grad_norm": 1.894225835800171,
	"learning_rate": 0.0001,
	"loss": 0.6599,
	"step": 19660
	},
	{
	"epoch": 1.0784152556304456,
	"grad_norm": 1.58738112449646,
	"learning_rate": 0.0001,
	"loss": 0.5796,
	"step": 19680
	},
	{
	"epoch": 1.0795112060934846,
	"grad_norm": 1.880391240119934,
	"learning_rate": 0.0001,
	"loss": 0.6305,
	"step": 19700
	},
	{
	"epoch": 1.0806071565565236,
	"grad_norm": 1.4821720123291016,
	"learning_rate": 0.0001,
	"loss": 0.5675,
	"step": 19720
	},
	{
	"epoch": 1.0817031070195626,
	"grad_norm": 1.504714846611023,
	"learning_rate": 0.0001,
	"loss": 0.5888,
	"step": 19740
	},
	{
	"epoch": 1.0827990574826019,
	"grad_norm": 1.6745513677597046,
	"learning_rate": 0.0001,
	"loss": 0.6199,
	"step": 19760
	},
	{
	"epoch": 1.0838950079456409,
	"grad_norm": 1.827014684677124,
	"learning_rate": 0.0001,
	"loss": 0.5889,
	"step": 19780
	},
	{
	"epoch": 1.0849909584086799,
	"grad_norm": 1.6627857685089111,
	"learning_rate": 0.0001,
	"loss": 0.5649,
	"step": 19800
	},
	{
	"epoch": 1.086086908871719,
	"grad_norm": 1.5660628080368042,
	"learning_rate": 0.0001,
	"loss": 0.6814,
	"step": 19820
	},
	{
	"epoch": 1.0871828593347581,
	"grad_norm": 1.4713698625564575,
	"learning_rate": 0.0001,
	"loss": 0.5789,
	"step": 19840
	},
	{
	"epoch": 1.0882788097977971,
	"grad_norm": 1.5290462970733643,
	"learning_rate": 0.0001,
	"loss": 0.5894,
	"step": 19860
	},
	{
	"epoch": 1.0893747602608361,
	"grad_norm": 1.7101823091506958,
	"learning_rate": 0.0001,
	"loss": 0.5732,
	"step": 19880
	},
	{
	"epoch": 1.0904707107238754,
	"grad_norm": 1.8752964735031128,
	"learning_rate": 0.0001,
	"loss": 0.6358,
	"step": 19900
	},
	{
	"epoch": 1.0915666611869144,
	"grad_norm": 1.7808418273925781,
	"learning_rate": 0.0001,
	"loss": 0.5942,
	"step": 19920
	},
	{
	"epoch": 1.0926626116499534,
	"grad_norm": 1.4797093868255615,
	"learning_rate": 0.0001,
	"loss": 0.605,
	"step": 19940
	},
	{
	"epoch": 1.0937585621129924,
	"grad_norm": 2.443544387817383,
	"learning_rate": 0.0001,
	"loss": 0.7019,
	"step": 19960
	},
	{
	"epoch": 1.0948545125760316,
	"grad_norm": 1.4167999029159546,
	"learning_rate": 0.0001,
	"loss": 0.5969,
	"step": 19980
	},
	{
	"epoch": 1.0959504630390706,
	"grad_norm": 1.3823322057724,
	"learning_rate": 0.0001,
	"loss": 0.634,
	"step": 20000
	},
	{
	"epoch": 1.0959504630390706,
	"eval_loss": 0.6163960099220276,
	"eval_runtime": 30555.9795,
	"eval_samples_per_second": 2.124,
	"eval_steps_per_second": 0.066,
	"eval_wer": 36.777449473248126,
	"step": 20000
	},
	{
	"epoch": 1.0970464135021096,
	"grad_norm": 1.5388779640197754,
	"learning_rate": 0.0001,
	"loss": 0.5836,
	"step": 20020
	},
	{
	"epoch": 1.0981423639651489,
	"grad_norm": 1.9624749422073364,
	"learning_rate": 0.0001,
	"loss": 0.5574,
	"step": 20040
	},
	{
	"epoch": 1.0992383144281879,
	"grad_norm": 1.4712483882904053,
	"learning_rate": 0.0001,
	"loss": 0.6284,
	"step": 20060
	},
	{
	"epoch": 1.1003342648912269,
	"grad_norm": 1.4846380949020386,
	"learning_rate": 0.0001,
	"loss": 0.5815,
	"step": 20080
	},
	{
	"epoch": 1.1014302153542659,
	"grad_norm": 1.4635918140411377,
	"learning_rate": 0.0001,
	"loss": 0.6003,
	"step": 20100
	},
	{
	"epoch": 1.1025261658173051,
	"grad_norm": 1.775586485862732,
	"learning_rate": 0.0001,
	"loss": 0.5997,
	"step": 20120
	},
	{
	"epoch": 1.1036221162803441,
	"grad_norm": 1.5434575080871582,
	"learning_rate": 0.0001,
	"loss": 0.5924,
	"step": 20140
	},
	{
	"epoch": 1.1047180667433831,
	"grad_norm": 1.661482572555542,
	"learning_rate": 0.0001,
	"loss": 0.6288,
	"step": 20160
	},
	{
	"epoch": 1.1058140172064224,
	"grad_norm": 1.706123948097229,
	"learning_rate": 0.0001,
	"loss": 0.5624,
	"step": 20180
	},
	{
	"epoch": 1.1069099676694614,
	"grad_norm": 1.9980905055999756,
	"learning_rate": 0.0001,
	"loss": 0.5577,
	"step": 20200
	},
	{
	"epoch": 1.1080059181325004,
	"grad_norm": 1.60072922706604,
	"learning_rate": 0.0001,
	"loss": 0.5947,
	"step": 20220
	},
	{
	"epoch": 1.1091018685955394,
	"grad_norm": 1.6381016969680786,
	"learning_rate": 0.0001,
	"loss": 0.5183,
	"step": 20240
	},
	{
	"epoch": 1.1101978190585786,
	"grad_norm": 1.7384517192840576,
	"learning_rate": 0.0001,
	"loss": 0.5752,
	"step": 20260
	},
	{
	"epoch": 1.1112937695216176,
	"grad_norm": 1.9785683155059814,
	"learning_rate": 0.0001,
	"loss": 0.576,
	"step": 20280
	},
	{
	"epoch": 1.1123897199846566,
	"grad_norm": 1.2318958044052124,
	"learning_rate": 0.0001,
	"loss": 0.5853,
	"step": 20300
	},
	{
	"epoch": 1.1134856704476959,
	"grad_norm": 1.5406831502914429,
	"learning_rate": 0.0001,
	"loss": 0.6059,
	"step": 20320
	},
	{
	"epoch": 1.1145816209107349,
	"grad_norm": 1.6655981540679932,
	"learning_rate": 0.0001,
	"loss": 0.6834,
	"step": 20340
	},
	{
	"epoch": 1.1156775713737739,
	"grad_norm": 1.513757586479187,
	"learning_rate": 0.0001,
	"loss": 0.6158,
	"step": 20360
	},
	{
	"epoch": 1.1167735218368129,
	"grad_norm": 2.1243133544921875,
	"learning_rate": 0.0001,
	"loss": 0.5769,
	"step": 20380
	},
	{
	"epoch": 1.1178694722998521,
	"grad_norm": 1.6118996143341064,
	"learning_rate": 0.0001,
	"loss": 0.5197,
	"step": 20400
	},
	{
	"epoch": 1.1189654227628911,
	"grad_norm": 1.8882734775543213,
	"learning_rate": 0.0001,
	"loss": 0.5459,
	"step": 20420
	},
	{
	"epoch": 1.1200613732259301,
	"grad_norm": 1.8385454416275024,
	"learning_rate": 0.0001,
	"loss": 0.5589,
	"step": 20440
	},
	{
	"epoch": 1.1211573236889691,
	"grad_norm": 1.7789567708969116,
	"learning_rate": 0.0001,
	"loss": 0.589,
	"step": 20460
	},
	{
	"epoch": 1.1222532741520084,
	"grad_norm": 1.839416265487671,
	"learning_rate": 0.0001,
	"loss": 0.5979,
	"step": 20480
	},
	{
	"epoch": 1.1233492246150474,
	"grad_norm": 1.8148174285888672,
	"learning_rate": 0.0001,
	"loss": 0.6179,
	"step": 20500
	},
	{
	"epoch": 1.1244451750780864,
	"grad_norm": 1.594193696975708,
	"learning_rate": 0.0001,
	"loss": 0.6427,
	"step": 20520
	},
	{
	"epoch": 1.1255411255411256,
	"grad_norm": 1.5754518508911133,
	"learning_rate": 0.0001,
	"loss": 0.5933,
	"step": 20540
	},
	{
	"epoch": 1.1266370760041646,
	"grad_norm": 1.7265543937683105,
	"learning_rate": 0.0001,
	"loss": 0.6021,
	"step": 20560
	},
	{
	"epoch": 1.1277330264672036,
	"grad_norm": 1.4708410501480103,
	"learning_rate": 0.0001,
	"loss": 0.5824,
	"step": 20580
	},
	{
	"epoch": 1.1288289769302429,
	"grad_norm": 1.7831743955612183,
	"learning_rate": 0.0001,
	"loss": 0.5806,
	"step": 20600
	},
	{
	"epoch": 1.1299249273932819,
	"grad_norm": 1.530446171760559,
	"learning_rate": 0.0001,
	"loss": 0.6523,
	"step": 20620
	},
	{
	"epoch": 1.1310208778563209,
	"grad_norm": 2.154409408569336,
	"learning_rate": 0.0001,
	"loss": 0.5898,
	"step": 20640
	},
	{
	"epoch": 1.13211682831936,
	"grad_norm": 1.3791108131408691,
	"learning_rate": 0.0001,
	"loss": 0.6321,
	"step": 20660
	},
	{
	"epoch": 1.1332127787823991,
	"grad_norm": 2.259727954864502,
	"learning_rate": 0.0001,
	"loss": 0.67,
	"step": 20680
	},
	{
	"epoch": 1.1343087292454381,
	"grad_norm": 1.7098194360733032,
	"learning_rate": 0.0001,
	"loss": 0.5554,
	"step": 20700
	},
	{
	"epoch": 1.1354046797084771,
	"grad_norm": 1.5874308347702026,
	"learning_rate": 0.0001,
	"loss": 0.5596,
	"step": 20720
	},
	{
	"epoch": 1.1365006301715161,
	"grad_norm": 1.9818806648254395,
	"learning_rate": 0.0001,
	"loss": 0.6618,
	"step": 20740
	},
	{
	"epoch": 1.1375965806345554,
	"grad_norm": 1.4672831296920776,
	"learning_rate": 0.0001,
	"loss": 0.5771,
	"step": 20760
	},
	{
	"epoch": 1.1386925310975944,
	"grad_norm": 1.746772050857544,
	"learning_rate": 0.0001,
	"loss": 0.6085,
	"step": 20780
	},
	{
	"epoch": 1.1397884815606334,
	"grad_norm": 1.7367818355560303,
	"learning_rate": 0.0001,
	"loss": 0.6401,
	"step": 20800
	},
	{
	"epoch": 1.1408844320236726,
	"grad_norm": 1.5269123315811157,
	"learning_rate": 0.0001,
	"loss": 0.678,
	"step": 20820
	},
	{
	"epoch": 1.1419803824867116,
	"grad_norm": 1.6921030282974243,
	"learning_rate": 0.0001,
	"loss": 0.6292,
	"step": 20840
	},
	{
	"epoch": 1.1430763329497506,
	"grad_norm": 1.4888218641281128,
	"learning_rate": 0.0001,
	"loss": 0.6034,
	"step": 20860
	},
	{
	"epoch": 1.1441722834127896,
	"grad_norm": 1.9028393030166626,
	"learning_rate": 0.0001,
	"loss": 0.604,
	"step": 20880
	},
	{
	"epoch": 1.1452682338758289,
	"grad_norm": 1.4702014923095703,
	"learning_rate": 0.0001,
	"loss": 0.6375,
	"step": 20900
	},
	{
	"epoch": 1.1463641843388679,
	"grad_norm": 1.9169687032699585,
	"learning_rate": 0.0001,
	"loss": 0.6173,
	"step": 20920
	},
	{
	"epoch": 1.147460134801907,
	"grad_norm": 1.6540066003799438,
	"learning_rate": 0.0001,
	"loss": 0.5366,
	"step": 20940
	},
	{
	"epoch": 1.148556085264946,
	"grad_norm": 1.564468502998352,
	"learning_rate": 0.0001,
	"loss": 0.5614,
	"step": 20960
	},
	{
	"epoch": 1.1496520357279851,
	"grad_norm": 1.75001060962677,
	"learning_rate": 0.0001,
	"loss": 0.6408,
	"step": 20980
	},
	{
	"epoch": 1.1507479861910241,
	"grad_norm": 1.759342074394226,
	"learning_rate": 0.0001,
	"loss": 0.6267,
	"step": 21000
	},
	{
	"epoch": 1.1507479861910241,
	"eval_loss": 0.6101906895637512,
	"eval_runtime": 30794.7182,
	"eval_samples_per_second": 2.107,
	"eval_steps_per_second": 0.066,
	"eval_wer": 46.360156536208414,
	"step": 21000
	},
	{
	"epoch": 1.1518439366540631,
	"grad_norm": 1.5255391597747803,
	"learning_rate": 0.0001,
	"loss": 0.6105,
	"step": 21020
	},
	{
	"epoch": 1.1529398871171024,
	"grad_norm": 1.8833086490631104,
	"learning_rate": 0.0001,
	"loss": 0.628,
	"step": 21040
	},
	{
	"epoch": 1.1540358375801414,
	"grad_norm": 1.6667803525924683,
	"learning_rate": 0.0001,
	"loss": 0.5758,
	"step": 21060
	},
	{
	"epoch": 1.1551317880431804,
	"grad_norm": 1.6798675060272217,
	"learning_rate": 0.0001,
	"loss": 0.5869,
	"step": 21080
	},
	{
	"epoch": 1.1562277385062196,
	"grad_norm": 1.3532921075820923,
	"learning_rate": 0.0001,
	"loss": 0.5978,
	"step": 21100
	},
	{
	"epoch": 1.1573236889692586,
	"grad_norm": 1.9075069427490234,
	"learning_rate": 0.0001,
	"loss": 0.636,
	"step": 21120
	},
	{
	"epoch": 1.1584196394322976,
	"grad_norm": 1.6051623821258545,
	"learning_rate": 0.0001,
	"loss": 0.6624,
	"step": 21140
	},
	{
	"epoch": 1.1595155898953367,
	"grad_norm": 1.6509668827056885,
	"learning_rate": 0.0001,
	"loss": 0.6098,
	"step": 21160
	},
	{
	"epoch": 1.1606115403583759,
	"grad_norm": 1.8513017892837524,
	"learning_rate": 0.0001,
	"loss": 0.5753,
	"step": 21180
	},
	{
	"epoch": 1.161707490821415,
	"grad_norm": 1.7680573463439941,
	"learning_rate": 0.0001,
	"loss": 0.5971,
	"step": 21200
	},
	{
	"epoch": 1.162803441284454,
	"grad_norm": 1.7778613567352295,
	"learning_rate": 0.0001,
	"loss": 0.6127,
	"step": 21220
	},
	{
	"epoch": 1.163899391747493,
	"grad_norm": 1.524961233139038,
	"learning_rate": 0.0001,
	"loss": 0.6181,
	"step": 21240
	},
	{
	"epoch": 1.1649953422105321,
	"grad_norm": 1.7401758432388306,
	"learning_rate": 0.0001,
	"loss": 0.6575,
	"step": 21260
	},
	{
	"epoch": 1.1660912926735711,
	"grad_norm": 1.7773276567459106,
	"learning_rate": 0.0001,
	"loss": 0.6264,
	"step": 21280
	},
	{
	"epoch": 1.1671872431366102,
	"grad_norm": 1.987033486366272,
	"learning_rate": 0.0001,
	"loss": 0.5309,
	"step": 21300
	},
	{
	"epoch": 1.1682831935996494,
	"grad_norm": 1.7425816059112549,
	"learning_rate": 0.0001,
	"loss": 0.6644,
	"step": 21320
	},
	{
	"epoch": 1.1693791440626884,
	"grad_norm": 1.6333574056625366,
	"learning_rate": 0.0001,
	"loss": 0.586,
	"step": 21340
	},
	{
	"epoch": 1.1704750945257274,
	"grad_norm": 1.6959367990493774,
	"learning_rate": 0.0001,
	"loss": 0.566,
	"step": 21360
	},
	{
	"epoch": 1.1715710449887666,
	"grad_norm": 1.6892461776733398,
	"learning_rate": 0.0001,
	"loss": 0.5788,
	"step": 21380
	},
	{
	"epoch": 1.1726669954518056,
	"grad_norm": 1.805227279663086,
	"learning_rate": 0.0001,
	"loss": 0.5984,
	"step": 21400
	},
	{
	"epoch": 1.1737629459148446,
	"grad_norm": 1.5054594278335571,
	"learning_rate": 0.0001,
	"loss": 0.5851,
	"step": 21420
	},
	{
	"epoch": 1.1748588963778837,
	"grad_norm": 1.7826286554336548,
	"learning_rate": 0.0001,
	"loss": 0.5872,
	"step": 21440
	},
	{
	"epoch": 1.1759548468409229,
	"grad_norm": 1.1451081037521362,
	"learning_rate": 0.0001,
	"loss": 0.5533,
	"step": 21460
	},
	{
	"epoch": 1.177050797303962,
	"grad_norm": 1.425122618675232,
	"learning_rate": 0.0001,
	"loss": 0.5934,
	"step": 21480
	},
	{
	"epoch": 1.178146747767001,
	"grad_norm": 1.6452502012252808,
	"learning_rate": 0.0001,
	"loss": 0.6008,
	"step": 21500
	},
	{
	"epoch": 1.17924269823004,
	"grad_norm": 1.6565967798233032,
	"learning_rate": 0.0001,
	"loss": 0.5945,
	"step": 21520
	},
	{
	"epoch": 1.1803386486930791,
	"grad_norm": 1.7541433572769165,
	"learning_rate": 0.0001,
	"loss": 0.6243,
	"step": 21540
	},
	{
	"epoch": 1.1814345991561181,
	"grad_norm": 1.5369079113006592,
	"learning_rate": 0.0001,
	"loss": 0.5968,
	"step": 21560
	},
	{
	"epoch": 1.1825305496191572,
	"grad_norm": 2.0941789150238037,
	"learning_rate": 0.0001,
	"loss": 0.599,
	"step": 21580
	},
	{
	"epoch": 1.1836265000821964,
	"grad_norm": 1.6641647815704346,
	"learning_rate": 0.0001,
	"loss": 0.634,
	"step": 21600
	},
	{
	"epoch": 1.1847224505452354,
	"grad_norm": 1.5256268978118896,
	"learning_rate": 0.0001,
	"loss": 0.5939,
	"step": 21620
	},
	{
	"epoch": 1.1858184010082744,
	"grad_norm": 1.5720540285110474,
	"learning_rate": 0.0001,
	"loss": 0.6005,
	"step": 21640
	},
	{
	"epoch": 1.1869143514713134,
	"grad_norm": 1.773973822593689,
	"learning_rate": 0.0001,
	"loss": 0.5607,
	"step": 21660
	},
	{
	"epoch": 1.1880103019343526,
	"grad_norm": 1.6868877410888672,
	"learning_rate": 0.0001,
	"loss": 0.6013,
	"step": 21680
	},
	{
	"epoch": 1.1891062523973916,
	"grad_norm": 1.518250584602356,
	"learning_rate": 0.0001,
	"loss": 0.612,
	"step": 21700
	},
	{
	"epoch": 1.1902022028604307,
	"grad_norm": 1.4469574689865112,
	"learning_rate": 0.0001,
	"loss": 0.5684,
	"step": 21720
	},
	{
	"epoch": 1.1912981533234697,
	"grad_norm": 1.3651134967803955,
	"learning_rate": 0.0001,
	"loss": 0.6275,
	"step": 21740
	},
	{
	"epoch": 1.192394103786509,
	"grad_norm": 1.1910673379898071,
	"learning_rate": 0.0001,
	"loss": 0.6281,
	"step": 21760
	},
	{
	"epoch": 1.193490054249548,
	"grad_norm": 1.5071038007736206,
	"learning_rate": 0.0001,
	"loss": 0.5909,
	"step": 21780
	},
	{
	"epoch": 1.194586004712587,
	"grad_norm": 1.3401362895965576,
	"learning_rate": 0.0001,
	"loss": 0.6273,
	"step": 21800
	},
	{
	"epoch": 1.1956819551756261,
	"grad_norm": 1.3563752174377441,
	"learning_rate": 0.0001,
	"loss": 0.5634,
	"step": 21820
	},
	{
	"epoch": 1.1967779056386652,
	"grad_norm": 1.5860759019851685,
	"learning_rate": 0.0001,
	"loss": 0.5996,
	"step": 21840
	},
	{
	"epoch": 1.1978738561017042,
	"grad_norm": 1.6106479167938232,
	"learning_rate": 0.0001,
	"loss": 0.6038,
	"step": 21860
	},
	{
	"epoch": 1.1989698065647434,
	"grad_norm": 1.2792236804962158,
	"learning_rate": 0.0001,
	"loss": 0.569,
	"step": 21880
	},
	{
	"epoch": 1.2000657570277824,
	"grad_norm": 1.7770174741744995,
	"learning_rate": 0.0001,
	"loss": 0.6159,
	"step": 21900
	},
	{
	"epoch": 1.2011617074908214,
	"grad_norm": 1.522647738456726,
	"learning_rate": 0.0001,
	"loss": 0.5756,
	"step": 21920
	},
	{
	"epoch": 1.2022576579538604,
	"grad_norm": 1.4393162727355957,
	"learning_rate": 0.0001,
	"loss": 0.598,
	"step": 21940
	},
	{
	"epoch": 1.2033536084168996,
	"grad_norm": 1.9221006631851196,
	"learning_rate": 0.0001,
	"loss": 0.5736,
	"step": 21960
	},
	{
	"epoch": 1.2044495588799387,
	"grad_norm": 1.4930051565170288,
	"learning_rate": 0.0001,
	"loss": 0.591,
	"step": 21980
	},
	{
	"epoch": 1.2055455093429777,
	"grad_norm": 1.1012686491012573,
	"learning_rate": 0.0001,
	"loss": 0.6139,
	"step": 22000
	},
	{
	"epoch": 1.2055455093429777,
	"eval_loss": 0.6032226085662842,
	"eval_runtime": 30533.3597,
	"eval_samples_per_second": 2.125,
	"eval_steps_per_second": 0.066,
	"eval_wer": 36.777449473248126,
	"step": 22000
	},
	{
	"epoch": 1.2066414598060167,
	"grad_norm": 1.501633644104004,
	"learning_rate": 0.0001,
	"loss": 0.55,
	"step": 22020
	},
	{
	"epoch": 1.207737410269056,
	"grad_norm": 1.7444618940353394,
	"learning_rate": 0.0001,
	"loss": 0.62,
	"step": 22040
	},
	{
	"epoch": 1.208833360732095,
	"grad_norm": 1.3666551113128662,
	"learning_rate": 0.0001,
	"loss": 0.6087,
	"step": 22060
	},
	{
	"epoch": 1.209929311195134,
	"grad_norm": 1.5576726198196411,
	"learning_rate": 0.0001,
	"loss": 0.5958,
	"step": 22080
	},
	{
	"epoch": 1.2110252616581731,
	"grad_norm": 1.457824945449829,
	"learning_rate": 0.0001,
	"loss": 0.5588,
	"step": 22100
	},
	{
	"epoch": 1.2121212121212122,
	"grad_norm": 1.621120810508728,
	"learning_rate": 0.0001,
	"loss": 0.5574,
	"step": 22120
	},
	{
	"epoch": 1.2132171625842512,
	"grad_norm": 1.1742050647735596,
	"learning_rate": 0.0001,
	"loss": 0.5498,
	"step": 22140
	},
	{
	"epoch": 1.2143131130472902,
	"grad_norm": 1.3734312057495117,
	"learning_rate": 0.0001,
	"loss": 0.5899,
	"step": 22160
	},
	{
	"epoch": 1.2154090635103294,
	"grad_norm": 2.046262741088867,
	"learning_rate": 0.0001,
	"loss": 0.6574,
	"step": 22180
	},
	{
	"epoch": 1.2165050139733684,
	"grad_norm": 1.3114126920700073,
	"learning_rate": 0.0001,
	"loss": 0.607,
	"step": 22200
	},
	{
	"epoch": 1.2176009644364074,
	"grad_norm": 1.5335580110549927,
	"learning_rate": 0.0001,
	"loss": 0.5828,
	"step": 22220
	},
	{
	"epoch": 1.2186969148994464,
	"grad_norm": 1.7492777109146118,
	"learning_rate": 0.0001,
	"loss": 0.557,
	"step": 22240
	},
	{
	"epoch": 1.2197928653624857,
	"grad_norm": 1.3159027099609375,
	"learning_rate": 0.0001,
	"loss": 0.6923,
	"step": 22260
	},
	{
	"epoch": 1.2208888158255247,
	"grad_norm": 1.5170766115188599,
	"learning_rate": 0.0001,
	"loss": 0.7194,
	"step": 22280
	},
	{
	"epoch": 1.2219847662885637,
	"grad_norm": 1.336846113204956,
	"learning_rate": 0.0001,
	"loss": 0.583,
	"step": 22300
	},
	{
	"epoch": 1.223080716751603,
	"grad_norm": 1.768999457359314,
	"learning_rate": 0.0001,
	"loss": 0.7009,
	"step": 22320
	},
	{
	"epoch": 1.224176667214642,
	"grad_norm": 1.6113883256912231,
	"learning_rate": 0.0001,
	"loss": 0.5747,
	"step": 22340
	},
	{
	"epoch": 1.225272617677681,
	"grad_norm": 1.4983850717544556,
	"learning_rate": 0.0001,
	"loss": 0.5477,
	"step": 22360
	},
	{
	"epoch": 1.2263685681407201,
	"grad_norm": 1.380181908607483,
	"learning_rate": 0.0001,
	"loss": 0.6003,
	"step": 22380
	},
	{
	"epoch": 1.2274645186037592,
	"grad_norm": 1.4921499490737915,
	"learning_rate": 0.0001,
	"loss": 0.586,
	"step": 22400
	},
	{
	"epoch": 1.2285604690667982,
	"grad_norm": 1.3056907653808594,
	"learning_rate": 0.0001,
	"loss": 0.5393,
	"step": 22420
	},
	{
	"epoch": 1.2296564195298372,
	"grad_norm": 1.702541470527649,
	"learning_rate": 0.0001,
	"loss": 0.6474,
	"step": 22440
	},
	{
	"epoch": 1.2307523699928764,
	"grad_norm": 1.703065276145935,
	"learning_rate": 0.0001,
	"loss": 0.6102,
	"step": 22460
	},
	{
	"epoch": 1.2318483204559154,
	"grad_norm": 1.7823582887649536,
	"learning_rate": 0.0001,
	"loss": 0.529,
	"step": 22480
	},
	{
	"epoch": 1.2329442709189544,
	"grad_norm": 1.5001643896102905,
	"learning_rate": 0.0001,
	"loss": 0.5936,
	"step": 22500
	},
	{
	"epoch": 1.2340402213819934,
	"grad_norm": 1.4515180587768555,
	"learning_rate": 0.0001,
	"loss": 0.5817,
	"step": 22520
	},
	{
	"epoch": 1.2351361718450327,
	"grad_norm": 1.6166529655456543,
	"learning_rate": 0.0001,
	"loss": 0.5901,
	"step": 22540
	},
	{
	"epoch": 1.2362321223080717,
	"grad_norm": 1.6117253303527832,
	"learning_rate": 0.0001,
	"loss": 0.668,
	"step": 22560
	},
	{
	"epoch": 1.2373280727711107,
	"grad_norm": 1.4674168825149536,
	"learning_rate": 0.0001,
	"loss": 0.5783,
	"step": 22580
	},
	{
	"epoch": 1.23842402323415,
	"grad_norm": 1.5282671451568604,
	"learning_rate": 0.0001,
	"loss": 0.6069,
	"step": 22600
	},
	{
	"epoch": 1.239519973697189,
	"grad_norm": 1.446772575378418,
	"learning_rate": 0.0001,
	"loss": 0.5645,
	"step": 22620
	},
	{
	"epoch": 1.240615924160228,
	"grad_norm": 1.7833497524261475,
	"learning_rate": 0.0001,
	"loss": 0.5555,
	"step": 22640
	},
	{
	"epoch": 1.241711874623267,
	"grad_norm": 1.8573659658432007,
	"learning_rate": 0.0001,
	"loss": 0.6258,
	"step": 22660
	},
	{
	"epoch": 1.2428078250863062,
	"grad_norm": 1.375735878944397,
	"learning_rate": 0.0001,
	"loss": 0.5316,
	"step": 22680
	},
	{
	"epoch": 1.2439037755493452,
	"grad_norm": 1.4545280933380127,
	"learning_rate": 0.0001,
	"loss": 0.609,
	"step": 22700
	},
	{
	"epoch": 1.2449997260123842,
	"grad_norm": 1.499182105064392,
	"learning_rate": 0.0001,
	"loss": 0.6205,
	"step": 22720
	},
	{
	"epoch": 1.2460956764754232,
	"grad_norm": 1.418739914894104,
	"learning_rate": 0.0001,
	"loss": 0.5038,
	"step": 22740
	},
	{
	"epoch": 1.2471916269384624,
	"grad_norm": 1.4958001375198364,
	"learning_rate": 0.0001,
	"loss": 0.5607,
	"step": 22760
	},
	{
	"epoch": 1.2482875774015014,
	"grad_norm": 1.7422837018966675,
	"learning_rate": 0.0001,
	"loss": 0.5593,
	"step": 22780
	},
	{
	"epoch": 1.2493835278645404,
	"grad_norm": 1.536526083946228,
	"learning_rate": 0.0001,
	"loss": 0.5518,
	"step": 22800
	},
	{
	"epoch": 1.2504794783275797,
	"grad_norm": 1.2415670156478882,
	"learning_rate": 0.0001,
	"loss": 0.625,
	"step": 22820
	},
	{
	"epoch": 1.2515754287906187,
	"grad_norm": 1.2609211206436157,
	"learning_rate": 0.0001,
	"loss": 0.5213,
	"step": 22840
	},
	{
	"epoch": 1.2526713792536577,
	"grad_norm": 1.4843876361846924,
	"learning_rate": 0.0001,
	"loss": 0.5618,
	"step": 22860
	},
	{
	"epoch": 1.253767329716697,
	"grad_norm": 1.7089099884033203,
	"learning_rate": 0.0001,
	"loss": 0.587,
	"step": 22880
	},
	{
	"epoch": 1.254863280179736,
	"grad_norm": 1.8894917964935303,
	"learning_rate": 0.0001,
	"loss": 0.5952,
	"step": 22900
	},
	{
	"epoch": 1.255959230642775,
	"grad_norm": 1.3892401456832886,
	"learning_rate": 0.0001,
	"loss": 0.5949,
	"step": 22920
	},
	{
	"epoch": 1.257055181105814,
	"grad_norm": 1.8688722848892212,
	"learning_rate": 0.0001,
	"loss": 0.6524,
	"step": 22940
	},
	{
	"epoch": 1.2581511315688532,
	"grad_norm": 1.8726931810379028,
	"learning_rate": 0.0001,
	"loss": 0.5547,
	"step": 22960
	},
	{
	"epoch": 1.2592470820318922,
	"grad_norm": 1.9214690923690796,
	"learning_rate": 0.0001,
	"loss": 0.618,
	"step": 22980
	},
	{
	"epoch": 1.2603430324949312,
	"grad_norm": 1.6148467063903809,
	"learning_rate": 0.0001,
	"loss": 0.4822,
	"step": 23000
	},
	{
	"epoch": 1.2603430324949312,
	"eval_loss": 0.599087655544281,
	"eval_runtime": 30610.1389,
	"eval_samples_per_second": 2.12,
	"eval_steps_per_second": 0.066,
	"eval_wer": 40.07337206794192,
	"step": 23000
	},
	{
	"epoch": 1.2614389829579702,
	"grad_norm": 1.536855936050415,
	"learning_rate": 0.0001,
	"loss": 0.5852,
	"step": 23020
	},
	{
	"epoch": 1.2625349334210094,
	"grad_norm": 1.884334683418274,
	"learning_rate": 0.0001,
	"loss": 0.6474,
	"step": 23040
	},
	{
	"epoch": 1.2636308838840484,
	"grad_norm": 1.359174132347107,
	"learning_rate": 0.0001,
	"loss": 0.6204,
	"step": 23060
	},
	{
	"epoch": 1.2647268343470874,
	"grad_norm": 1.7376055717468262,
	"learning_rate": 0.0001,
	"loss": 0.5524,
	"step": 23080
	},
	{
	"epoch": 1.2658227848101267,
	"grad_norm": 1.6594703197479248,
	"learning_rate": 0.0001,
	"loss": 0.5396,
	"step": 23100
	},
	{
	"epoch": 1.2669187352731657,
	"grad_norm": 1.4215294122695923,
	"learning_rate": 0.0001,
	"loss": 0.5842,
	"step": 23120
	},
	{
	"epoch": 1.2680146857362047,
	"grad_norm": 1.7680842876434326,
	"learning_rate": 0.0001,
	"loss": 0.5625,
	"step": 23140
	},
	{
	"epoch": 1.269110636199244,
	"grad_norm": 1.3353180885314941,
	"learning_rate": 0.0001,
	"loss": 0.5775,
	"step": 23160
	},
	{
	"epoch": 1.270206586662283,
	"grad_norm": 1.450649619102478,
	"learning_rate": 0.0001,
	"loss": 0.5319,
	"step": 23180
	},
	{
	"epoch": 1.271302537125322,
	"grad_norm": 1.7398178577423096,
	"learning_rate": 0.0001,
	"loss": 0.5615,
	"step": 23200
	},
	{
	"epoch": 1.272398487588361,
	"grad_norm": 1.6940994262695312,
	"learning_rate": 0.0001,
	"loss": 0.6069,
	"step": 23220
	},
	{
	"epoch": 1.2734944380514,
	"grad_norm": 1.899994969367981,
	"learning_rate": 0.0001,
	"loss": 0.6491,
	"step": 23240
	},
	{
	"epoch": 1.2745903885144392,
	"grad_norm": 1.457036018371582,
	"learning_rate": 0.0001,
	"loss": 0.5762,
	"step": 23260
	},
	{
	"epoch": 1.2756863389774782,
	"grad_norm": 1.4215611219406128,
	"learning_rate": 0.0001,
	"loss": 0.5966,
	"step": 23280
	},
	{
	"epoch": 1.2767822894405172,
	"grad_norm": 1.7165329456329346,
	"learning_rate": 0.0001,
	"loss": 0.5897,
	"step": 23300
	},
	{
	"epoch": 1.2778782399035564,
	"grad_norm": 1.524688720703125,
	"learning_rate": 0.0001,
	"loss": 0.6541,
	"step": 23320
	},
	{
	"epoch": 1.2789741903665954,
	"grad_norm": 1.3125251531600952,
	"learning_rate": 0.0001,
	"loss": 0.521,
	"step": 23340
	},
	{
	"epoch": 1.2800701408296344,
	"grad_norm": 1.5787118673324585,
	"learning_rate": 0.0001,
	"loss": 0.5453,
	"step": 23360
	},
	{
	"epoch": 1.2811660912926737,
	"grad_norm": 1.636098027229309,
	"learning_rate": 0.0001,
	"loss": 0.5606,
	"step": 23380
	},
	{
	"epoch": 1.2822620417557127,
	"grad_norm": 1.4963462352752686,
	"learning_rate": 0.0001,
	"loss": 0.6251,
	"step": 23400
	},
	{
	"epoch": 1.2833579922187517,
	"grad_norm": 1.3213664293289185,
	"learning_rate": 0.0001,
	"loss": 0.6293,
	"step": 23420
	},
	{
	"epoch": 1.284453942681791,
	"grad_norm": 1.6737782955169678,
	"learning_rate": 0.0001,
	"loss": 0.6499,
	"step": 23440
	},
	{
	"epoch": 1.28554989314483,
	"grad_norm": 1.525976300239563,
	"learning_rate": 0.0001,
	"loss": 0.6073,
	"step": 23460
	},
	{
	"epoch": 1.286645843607869,
	"grad_norm": 1.3534733057022095,
	"learning_rate": 0.0001,
	"loss": 0.5434,
	"step": 23480
	},
	{
	"epoch": 1.287741794070908,
	"grad_norm": 1.8090375661849976,
	"learning_rate": 0.0001,
	"loss": 0.6806,
	"step": 23500
	},
	{
	"epoch": 1.288837744533947,
	"grad_norm": 1.7110000848770142,
	"learning_rate": 0.0001,
	"loss": 0.5678,
	"step": 23520
	},
	{
	"epoch": 1.2899336949969862,
	"grad_norm": 1.6300121545791626,
	"learning_rate": 0.0001,
	"loss": 0.6674,
	"step": 23540
	},
	{
	"epoch": 1.2910296454600252,
	"grad_norm": 1.4068278074264526,
	"learning_rate": 0.0001,
	"loss": 0.5294,
	"step": 23560
	},
	{
	"epoch": 1.2921255959230642,
	"grad_norm": 1.6015020608901978,
	"learning_rate": 0.0001,
	"loss": 0.5791,
	"step": 23580
	},
	{
	"epoch": 1.2932215463861034,
	"grad_norm": 1.7282171249389648,
	"learning_rate": 0.0001,
	"loss": 0.6358,
	"step": 23600
	},
	{
	"epoch": 1.2943174968491424,
	"grad_norm": 1.3395479917526245,
	"learning_rate": 0.0001,
	"loss": 0.5972,
	"step": 23620
	},
	{
	"epoch": 1.2954134473121814,
	"grad_norm": 1.5393882989883423,
	"learning_rate": 0.0001,
	"loss": 0.6243,
	"step": 23640
	},
	{
	"epoch": 1.2965093977752207,
	"grad_norm": 2.0010182857513428,
	"learning_rate": 0.0001,
	"loss": 0.6047,
	"step": 23660
	},
	{
	"epoch": 1.2976053482382597,
	"grad_norm": 1.742031455039978,
	"learning_rate": 0.0001,
	"loss": 0.586,
	"step": 23680
	},
	{
	"epoch": 1.2987012987012987,
	"grad_norm": 1.5596591234207153,
	"learning_rate": 0.0001,
	"loss": 0.5545,
	"step": 23700
	},
	{
	"epoch": 1.2997972491643377,
	"grad_norm": 1.2098394632339478,
	"learning_rate": 0.0001,
	"loss": 0.6264,
	"step": 23720
	},
	{
	"epoch": 1.3008931996273767,
	"grad_norm": 1.5962443351745605,
	"learning_rate": 0.0001,
	"loss": 0.5827,
	"step": 23740
	},
	{
	"epoch": 1.301989150090416,
	"grad_norm": 1.7482990026474,
	"learning_rate": 0.0001,
	"loss": 0.6113,
	"step": 23760
	},
	{
	"epoch": 1.303085100553455,
	"grad_norm": 1.6832690238952637,
	"learning_rate": 0.0001,
	"loss": 0.5231,
	"step": 23780
	},
	{
	"epoch": 1.304181051016494,
	"grad_norm": 1.2904006242752075,
	"learning_rate": 0.0001,
	"loss": 0.5472,
	"step": 23800
	},
	{
	"epoch": 1.3052770014795332,
	"grad_norm": 1.260377287864685,
	"learning_rate": 0.0001,
	"loss": 0.5555,
	"step": 23820
	},
	{
	"epoch": 1.3063729519425722,
	"grad_norm": 1.6346126794815063,
	"learning_rate": 0.0001,
	"loss": 0.5247,
	"step": 23840
	},
	{
	"epoch": 1.3074689024056112,
	"grad_norm": 1.5854252576828003,
	"learning_rate": 0.0001,
	"loss": 0.5784,
	"step": 23860
	},
	{
	"epoch": 1.3085648528686504,
	"grad_norm": 1.754293441772461,
	"learning_rate": 0.0001,
	"loss": 0.6555,
	"step": 23880
	},
	{
	"epoch": 1.3096608033316894,
	"grad_norm": 1.642504096031189,
	"learning_rate": 0.0001,
	"loss": 0.5822,
	"step": 23900
	},
	{
	"epoch": 1.3107567537947284,
	"grad_norm": 1.4986265897750854,
	"learning_rate": 0.0001,
	"loss": 0.6246,
	"step": 23920
	},
	{
	"epoch": 1.3118527042577677,
	"grad_norm": 1.6175062656402588,
	"learning_rate": 0.0001,
	"loss": 0.5616,
	"step": 23940
	},
	{
	"epoch": 1.3129486547208067,
	"grad_norm": 1.6189128160476685,
	"learning_rate": 0.0001,
	"loss": 0.6108,
	"step": 23960
	},
	{
	"epoch": 1.3140446051838457,
	"grad_norm": 1.6187801361083984,
	"learning_rate": 0.0001,
	"loss": 0.5992,
	"step": 23980
	},
	{
	"epoch": 1.3151405556468847,
	"grad_norm": 1.396136999130249,
	"learning_rate": 0.0001,
	"loss": 0.5409,
	"step": 24000
	},
	{
	"epoch": 1.3151405556468847,
	"eval_loss": 0.5925264358520508,
	"eval_runtime": 30722.0761,
	"eval_samples_per_second": 2.112,
	"eval_steps_per_second": 0.066,
	"eval_wer": 50.53154519589281,
	"step": 24000
	},
	{
	"epoch": 1.3162365061099237,
	"grad_norm": 1.4604203701019287,
	"learning_rate": 0.0001,
	"loss": 0.5795,
	"step": 24020
	},
	{
	"epoch": 1.317332456572963,
	"grad_norm": 1.667830228805542,
	"learning_rate": 0.0001,
	"loss": 0.5799,
	"step": 24040
	},
	{
	"epoch": 1.318428407036002,
	"grad_norm": 1.4066877365112305,
	"learning_rate": 0.0001,
	"loss": 0.603,
	"step": 24060
	},
	{
	"epoch": 1.319524357499041,
	"grad_norm": 1.6986689567565918,
	"learning_rate": 0.0001,
	"loss": 0.5943,
	"step": 24080
	},
	{
	"epoch": 1.3206203079620802,
	"grad_norm": 2.00864839553833,
	"learning_rate": 0.0001,
	"loss": 0.646,
	"step": 24100
	},
	{
	"epoch": 1.3217162584251192,
	"grad_norm": 1.3557894229888916,
	"learning_rate": 0.0001,
	"loss": 0.6324,
	"step": 24120
	},
	{
	"epoch": 1.3228122088881582,
	"grad_norm": 1.442983865737915,
	"learning_rate": 0.0001,
	"loss": 0.5326,
	"step": 24140
	},
	{
	"epoch": 1.3239081593511974,
	"grad_norm": 1.4924156665802002,
	"learning_rate": 0.0001,
	"loss": 0.5464,
	"step": 24160
	},
	{
	"epoch": 1.3250041098142364,
	"grad_norm": 1.408599615097046,
	"learning_rate": 0.0001,
	"loss": 0.5989,
	"step": 24180
	},
	{
	"epoch": 1.3261000602772754,
	"grad_norm": 1.6432658433914185,
	"learning_rate": 0.0001,
	"loss": 0.6034,
	"step": 24200
	},
	{
	"epoch": 1.3271960107403145,
	"grad_norm": 1.5687427520751953,
	"learning_rate": 0.0001,
	"loss": 0.5222,
	"step": 24220
	},
	{
	"epoch": 1.3282919612033537,
	"grad_norm": 1.3878777027130127,
	"learning_rate": 0.0001,
	"loss": 0.5913,
	"step": 24240
	},
	{
	"epoch": 1.3293879116663927,
	"grad_norm": 1.276931643486023,
	"learning_rate": 0.0001,
	"loss": 0.5509,
	"step": 24260
	},
	{
	"epoch": 1.3304838621294317,
	"grad_norm": 1.5601953268051147,
	"learning_rate": 0.0001,
	"loss": 0.6077,
	"step": 24280
	},
	{
	"epoch": 1.3315798125924707,
	"grad_norm": 1.9250099658966064,
	"learning_rate": 0.0001,
	"loss": 0.5629,
	"step": 24300
	},
	{
	"epoch": 1.33267576305551,
	"grad_norm": 1.314794659614563,
	"learning_rate": 0.0001,
	"loss": 0.6085,
	"step": 24320
	},
	{
	"epoch": 1.333771713518549,
	"grad_norm": 1.4445682764053345,
	"learning_rate": 0.0001,
	"loss": 0.5725,
	"step": 24340
	},
	{
	"epoch": 1.334867663981588,
	"grad_norm": 1.6029905080795288,
	"learning_rate": 0.0001,
	"loss": 0.6448,
	"step": 24360
	},
	{
	"epoch": 1.3359636144446272,
	"grad_norm": 1.969078540802002,
	"learning_rate": 0.0001,
	"loss": 0.5397,
	"step": 24380
	},
	{
	"epoch": 1.3370595649076662,
	"grad_norm": 1.900762677192688,
	"learning_rate": 0.0001,
	"loss": 0.6243,
	"step": 24400
	},
	{
	"epoch": 1.3381555153707052,
	"grad_norm": 1.8829255104064941,
	"learning_rate": 0.0001,
	"loss": 0.5744,
	"step": 24420
	},
	{
	"epoch": 1.3392514658337444,
	"grad_norm": 1.4927318096160889,
	"learning_rate": 0.0001,
	"loss": 0.6023,
	"step": 24440
	},
	{
	"epoch": 1.3403474162967834,
	"grad_norm": 1.7608602046966553,
	"learning_rate": 0.0001,
	"loss": 0.5654,
	"step": 24460
	},
	{
	"epoch": 1.3414433667598225,
	"grad_norm": 1.2257969379425049,
	"learning_rate": 0.0001,
	"loss": 0.5953,
	"step": 24480
	},
	{
	"epoch": 1.3425393172228615,
	"grad_norm": 1.5768262147903442,
	"learning_rate": 0.0001,
	"loss": 0.5972,
	"step": 24500
	},
	{
	"epoch": 1.3436352676859005,
	"grad_norm": 1.5148476362228394,
	"learning_rate": 0.0001,
	"loss": 0.6313,
	"step": 24520
	},
	{
	"epoch": 1.3447312181489397,
	"grad_norm": 1.347442865371704,
	"learning_rate": 0.0001,
	"loss": 0.5867,
	"step": 24540
	},
	{
	"epoch": 1.3458271686119787,
	"grad_norm": 1.3003042936325073,
	"learning_rate": 0.0001,
	"loss": 0.5709,
	"step": 24560
	},
	{
	"epoch": 1.3469231190750177,
	"grad_norm": 1.5577054023742676,
	"learning_rate": 0.0001,
	"loss": 0.5719,
	"step": 24580
	},
	{
	"epoch": 1.348019069538057,
	"grad_norm": 1.6141449213027954,
	"learning_rate": 0.0001,
	"loss": 0.5684,
	"step": 24600
	},
	{
	"epoch": 1.349115020001096,
	"grad_norm": 1.515576958656311,
	"learning_rate": 0.0001,
	"loss": 0.5421,
	"step": 24620
	},
	{
	"epoch": 1.350210970464135,
	"grad_norm": 1.62236487865448,
	"learning_rate": 0.0001,
	"loss": 0.6338,
	"step": 24640
	},
	{
	"epoch": 1.3513069209271742,
	"grad_norm": 1.5557656288146973,
	"learning_rate": 0.0001,
	"loss": 0.55,
	"step": 24660
	},
	{
	"epoch": 1.3524028713902132,
	"grad_norm": 1.9079481363296509,
	"learning_rate": 0.0001,
	"loss": 0.6352,
	"step": 24680
	},
	{
	"epoch": 1.3534988218532522,
	"grad_norm": 1.3640868663787842,
	"learning_rate": 0.0001,
	"loss": 0.6484,
	"step": 24700
	},
	{
	"epoch": 1.3545947723162914,
	"grad_norm": 1.831858515739441,
	"learning_rate": 0.0001,
	"loss": 0.5577,
	"step": 24720
	},
	{
	"epoch": 1.3556907227793304,
	"grad_norm": 1.5431773662567139,
	"learning_rate": 0.0001,
	"loss": 0.5918,
	"step": 24740
	},
	{
	"epoch": 1.3567866732423695,
	"grad_norm": 1.1655539274215698,
	"learning_rate": 0.0001,
	"loss": 0.5892,
	"step": 24760
	},
	{
	"epoch": 1.3578826237054085,
	"grad_norm": 1.7395954132080078,
	"learning_rate": 0.0001,
	"loss": 0.5416,
	"step": 24780
	},
	{
	"epoch": 1.3589785741684475,
	"grad_norm": 1.89164400100708,
	"learning_rate": 0.0001,
	"loss": 0.5708,
	"step": 24800
	},
	{
	"epoch": 1.3600745246314867,
	"grad_norm": 1.5013233423233032,
	"learning_rate": 0.0001,
	"loss": 0.5234,
	"step": 24820
	},
	{
	"epoch": 1.3611704750945257,
	"grad_norm": 1.4959980249404907,
	"learning_rate": 0.0001,
	"loss": 0.7578,
	"step": 24840
	},
	{
	"epoch": 1.3622664255575647,
	"grad_norm": 1.3962562084197998,
	"learning_rate": 0.0001,
	"loss": 0.564,
	"step": 24860
	},
	{
	"epoch": 1.363362376020604,
	"grad_norm": 1.370695948600769,
	"learning_rate": 0.0001,
	"loss": 0.5533,
	"step": 24880
	},
	{
	"epoch": 1.364458326483643,
	"grad_norm": 1.629671573638916,
	"learning_rate": 0.0001,
	"loss": 0.5463,
	"step": 24900
	},
	{
	"epoch": 1.365554276946682,
	"grad_norm": 1.6115111112594604,
	"learning_rate": 0.0001,
	"loss": 0.5837,
	"step": 24920
	},
	{
	"epoch": 1.3666502274097212,
	"grad_norm": 1.756898283958435,
	"learning_rate": 0.0001,
	"loss": 0.5784,
	"step": 24940
	},
	{
	"epoch": 1.3677461778727602,
	"grad_norm": 1.3999930620193481,
	"learning_rate": 0.0001,
	"loss": 0.6007,
	"step": 24960
	},
	{
	"epoch": 1.3688421283357992,
	"grad_norm": 1.3553202152252197,
	"learning_rate": 0.0001,
	"loss": 0.5996,
	"step": 24980
	},
	{
	"epoch": 1.3699380787988382,
	"grad_norm": 1.3020998239517212,
	"learning_rate": 0.0001,
	"loss": 0.5006,
	"step": 25000
	},
	{
	"epoch": 1.3699380787988382,
	"eval_loss": 0.5878660678863525,
	"eval_runtime": 30562.5187,
	"eval_samples_per_second": 2.123,
	"eval_steps_per_second": 0.066,
	"eval_wer": 44.19117823283905,
	"step": 25000
	},
	{
	"epoch": 1.3710340292618772,
	"grad_norm": 1.622175931930542,
	"learning_rate": 0.0001,
	"loss": 0.6049,
	"step": 25020
	},
	{
	"epoch": 1.3721299797249165,
	"grad_norm": 1.6178827285766602,
	"learning_rate": 0.0001,
	"loss": 0.6272,
	"step": 25040
	},
	{
	"epoch": 1.3732259301879555,
	"grad_norm": 1.9687530994415283,
	"learning_rate": 0.0001,
	"loss": 0.6194,
	"step": 25060
	},
	{
	"epoch": 1.3743218806509945,
	"grad_norm": 1.5638937950134277,
	"learning_rate": 0.0001,
	"loss": 0.6033,
	"step": 25080
	},
	{
	"epoch": 1.3754178311140337,
	"grad_norm": 1.5316487550735474,
	"learning_rate": 0.0001,
	"loss": 0.6847,
	"step": 25100
	},
	{
	"epoch": 1.3765137815770727,
	"grad_norm": 2.431041717529297,
	"learning_rate": 0.0001,
	"loss": 0.5975,
	"step": 25120
	},
	{
	"epoch": 1.3776097320401117,
	"grad_norm": 1.2522825002670288,
	"learning_rate": 0.0001,
	"loss": 0.6188,
	"step": 25140
	},
	{
	"epoch": 1.378705682503151,
	"grad_norm": 1.428832769393921,
	"learning_rate": 0.0001,
	"loss": 0.4743,
	"step": 25160
	},
	{
	"epoch": 1.37980163296619,
	"grad_norm": 1.6147892475128174,
	"learning_rate": 0.0001,
	"loss": 0.6463,
	"step": 25180
	},
	{
	"epoch": 1.380897583429229,
	"grad_norm": 1.6648330688476562,
	"learning_rate": 0.0001,
	"loss": 0.556,
	"step": 25200
	},
	{
	"epoch": 1.3819935338922682,
	"grad_norm": 1.4745285511016846,
	"learning_rate": 0.0001,
	"loss": 0.5997,
	"step": 25220
	},
	{
	"epoch": 1.3830894843553072,
	"grad_norm": 1.433664321899414,
	"learning_rate": 0.0001,
	"loss": 0.5288,
	"step": 25240
	},
	{
	"epoch": 1.3841854348183462,
	"grad_norm": 1.264054775238037,
	"learning_rate": 0.0001,
	"loss": 0.6075,
	"step": 25260
	},
	{
	"epoch": 1.3852813852813852,
	"grad_norm": 1.7683794498443604,
	"learning_rate": 0.0001,
	"loss": 0.6011,
	"step": 25280
	},
	{
	"epoch": 1.3863773357444242,
	"grad_norm": 1.5316460132598877,
	"learning_rate": 0.0001,
	"loss": 0.5799,
	"step": 25300
	},
	{
	"epoch": 1.3874732862074635,
	"grad_norm": 3.361269950866699,
	"learning_rate": 0.0001,
	"loss": 0.6577,
	"step": 25320
	},
	{
	"epoch": 1.3885692366705025,
	"grad_norm": 1.7918739318847656,
	"learning_rate": 0.0001,
	"loss": 0.6106,
	"step": 25340
	},
	{
	"epoch": 1.3896651871335415,
	"grad_norm": 1.5828975439071655,
	"learning_rate": 0.0001,
	"loss": 0.5683,
	"step": 25360
	},
	{
	"epoch": 1.3907611375965807,
	"grad_norm": 1.9565653800964355,
	"learning_rate": 0.0001,
	"loss": 0.5368,
	"step": 25380
	},
	{
	"epoch": 1.3918570880596197,
	"grad_norm": 1.446603775024414,
	"learning_rate": 0.0001,
	"loss": 0.551,
	"step": 25400
	},
	{
	"epoch": 1.3929530385226587,
	"grad_norm": 1.3377403020858765,
	"learning_rate": 0.0001,
	"loss": 0.5889,
	"step": 25420
	},
	{
	"epoch": 1.394048988985698,
	"grad_norm": 1.5956981182098389,
	"learning_rate": 0.0001,
	"loss": 0.5962,
	"step": 25440
	},
	{
	"epoch": 1.395144939448737,
	"grad_norm": 2.122570276260376,
	"learning_rate": 0.0001,
	"loss": 0.6044,
	"step": 25460
	},
	{
	"epoch": 1.396240889911776,
	"grad_norm": 1.8314157724380493,
	"learning_rate": 0.0001,
	"loss": 0.5612,
	"step": 25480
	},
	{
	"epoch": 1.397336840374815,
	"grad_norm": 1.327453851699829,
	"learning_rate": 0.0001,
	"loss": 0.5214,
	"step": 25500
	},
	{
	"epoch": 1.3984327908378542,
	"grad_norm": 2.1016182899475098,
	"learning_rate": 0.0001,
	"loss": 0.594,
	"step": 25520
	},
	{
	"epoch": 1.3995287413008932,
	"grad_norm": 1.5892709493637085,
	"learning_rate": 0.0001,
	"loss": 0.5927,
	"step": 25540
	},
	{
	"epoch": 1.4006246917639322,
	"grad_norm": 1.8178175687789917,
	"learning_rate": 0.0001,
	"loss": 0.5204,
	"step": 25560
	},
	{
	"epoch": 1.4017206422269712,
	"grad_norm": 1.3808900117874146,
	"learning_rate": 0.0001,
	"loss": 0.5434,
	"step": 25580
	},
	{
	"epoch": 1.4028165926900105,
	"grad_norm": 1.4849821329116821,
	"learning_rate": 0.0001,
	"loss": 0.6208,
	"step": 25600
	},
	{
	"epoch": 1.4039125431530495,
	"grad_norm": 1.5404740571975708,
	"learning_rate": 0.0001,
	"loss": 0.5492,
	"step": 25620
	},
	{
	"epoch": 1.4050084936160885,
	"grad_norm": 1.4663268327713013,
	"learning_rate": 0.0001,
	"loss": 0.5275,
	"step": 25640
	},
	{
	"epoch": 1.4061044440791277,
	"grad_norm": 1.5518896579742432,
	"learning_rate": 0.0001,
	"loss": 0.5966,
	"step": 25660
	},
	{
	"epoch": 1.4072003945421667,
	"grad_norm": 1.5495002269744873,
	"learning_rate": 0.0001,
	"loss": 0.5451,
	"step": 25680
	},
	{
	"epoch": 1.4082963450052057,
	"grad_norm": 1.5400805473327637,
	"learning_rate": 0.0001,
	"loss": 0.6543,
	"step": 25700
	},
	{
	"epoch": 1.409392295468245,
	"grad_norm": 1.5806297063827515,
	"learning_rate": 0.0001,
	"loss": 0.5849,
	"step": 25720
	},
	{
	"epoch": 1.410488245931284,
	"grad_norm": 1.574846863746643,
	"learning_rate": 0.0001,
	"loss": 0.5653,
	"step": 25740
	},
	{
	"epoch": 1.411584196394323,
	"grad_norm": 1.4742170572280884,
	"learning_rate": 0.0001,
	"loss": 0.5173,
	"step": 25760
	},
	{
	"epoch": 1.412680146857362,
	"grad_norm": 2.009706735610962,
	"learning_rate": 0.0001,
	"loss": 0.5467,
	"step": 25780
	},
	{
	"epoch": 1.413776097320401,
	"grad_norm": 1.9192876815795898,
	"learning_rate": 0.0001,
	"loss": 0.6211,
	"step": 25800
	},
	{
	"epoch": 1.4148720477834402,
	"grad_norm": 1.2425312995910645,
	"learning_rate": 0.0001,
	"loss": 0.5398,
	"step": 25820
	},
	{
	"epoch": 1.4159679982464792,
	"grad_norm": 1.8032817840576172,
	"learning_rate": 0.0001,
	"loss": 0.6143,
	"step": 25840
	},
	{
	"epoch": 1.4170639487095182,
	"grad_norm": 1.5889620780944824,
	"learning_rate": 0.0001,
	"loss": 0.6361,
	"step": 25860
	},
	{
	"epoch": 1.4181598991725575,
	"grad_norm": 1.3312866687774658,
	"learning_rate": 0.0001,
	"loss": 0.637,
	"step": 25880
	},
	{
	"epoch": 1.4192558496355965,
	"grad_norm": 1.4662201404571533,
	"learning_rate": 0.0001,
	"loss": 0.6206,
	"step": 25900
	},
	{
	"epoch": 1.4203518000986355,
	"grad_norm": 1.7590441703796387,
	"learning_rate": 0.0001,
	"loss": 0.5637,
	"step": 25920
	},
	{
	"epoch": 1.4214477505616747,
	"grad_norm": 1.5360428094863892,
	"learning_rate": 0.0001,
	"loss": 0.6033,
	"step": 25940
	},
	{
	"epoch": 1.4225437010247137,
	"grad_norm": 1.6273736953735352,
	"learning_rate": 0.0001,
	"loss": 0.559,
	"step": 25960
	},
	{
	"epoch": 1.4236396514877527,
	"grad_norm": 1.3700859546661377,
	"learning_rate": 0.0001,
	"loss": 0.637,
	"step": 25980
	},
	{
	"epoch": 1.4247356019507917,
	"grad_norm": 1.419872522354126,
	"learning_rate": 0.0001,
	"loss": 0.5674,
	"step": 26000
	},
	{
	"epoch": 1.4247356019507917,
	"eval_loss": 0.5845187306404114,
	"eval_runtime": 30268.7098,
	"eval_samples_per_second": 2.144,
	"eval_steps_per_second": 0.067,
	"eval_wer": 33.472796184515516,
	"step": 26000
	}
	],
	"logging_steps": 20,
	"max_steps": 54747,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 3,
	"save_steps": 1000,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 1.278115609397166e+21,
	"train_batch_size": 8,
	"trial_name": null,
	"trial_params": null
	}